semo

SEMO Research

[SEMO Lab] ADAPT: As-Needed Decomposition and Planning with Language Models

TL;DR & Key TakeawaysADAPT는 LLM 에이전트가 복잡한 과업 수행 중 실패에 직면했을 때, 그 시점에서 필요한 만큼만 과업을 재귀적으로 분해하고 계획을 수정하는 동적 프레임워크입니다.고정된 계획을 따르거나(Plan-and-Execute) 전체 과업을 반복 시도하는(ReAct, Reflexion) 기존 방식과 달리, 플래너-실행기 모듈을 분리하고 ‘실패 기반 분해(as-needed decomposition)’를 도입했습니다.ALFWorld, WebShop, TextCraft 세 가지 각기 다른 환경에서 기존 SOTA 모델 대비 성공률을 각각 최대 28.3%p, 27%p, 33%p까지 크게 향상했습니다.실행기(Executor) LLM의 성능(GPT-4, LLaMA 등)이나 과업의 고유한 ..

SEMO Research

[SEMO Lab] Tasklama - apply to semo

1. 서론 – TaskLAMA 기반 실험 설계 취지SEMO는 복잡한 아이디어를 WBS(Work-Breakdown Structure)로 자동 전개하는 서비스입니다. 이번 연구·개선 계획은 Google Research의 TaskLAMA 벤치마크에서 제시한 과제-그래프 평가 지표 (노드 Hungarian F1, Edge Hungarian F1, Step Proximity 등)를 적극 차용·응용하여, SEMO의 현행 ICL(단일 In-Context Learning) 기반 파이프라인을 체계적으로 고도화하는 것을 목표로 합니다. TaskLAMA는 1612개 과제·12118개 단계·11105개 의존성을 수작업으로 주석해 LLM의 복합 과제 이해 능력을 정량 검증할 수 있는 데이터셋으로, 기존 베이스라인 대비 LLM ..

SEMO Research

[SEMO Lab] Introduction

SEMO 소개일은 세모로.세모와 함께하는 바이브 워킹 SEMO - AI와 함께 만드는 빈틈없는 기획과 시작당신의 아이디어를 SEMO가 실행 가능한 계획으로. 기업가, PM, 프리랜서 모두를 위한 AI 기반 프로젝트 기획 도구www.semo.world 목표·아이디어 입력 → AI가 즉시 업무 구조도를 생성해 단계별 실행 플로우를 제시합니다. 리스트·로드맵·칸반·플로우 등 다양한 뷰에서 계획이 실시간으로 업데이트되어 진행 상황을 한눈에 확인합니다. 클릭 한 번으로 리스크 파악과 우선순위까지 도와주는 ‘바이브 플래닝’으로 실행 가능한 계획을 완성합니다. SEMO Lab 소개‘SEMO Lab 시리즈’는 최신 Task Planning 연구와 SEMO WBS 엔진을 교차 분석하여, 1. 새로운 방법론을 제품에 ..

Bug Detector
'semo' 태그의 글 목록