TL;DR & Key TakeawaysADAPT는 LLM 에이전트가 복잡한 과업 수행 중 실패에 직면했을 때, 그 시점에서 필요한 만큼만 과업을 재귀적으로 분해하고 계획을 수정하는 동적 프레임워크입니다.고정된 계획을 따르거나(Plan-and-Execute) 전체 과업을 반복 시도하는(ReAct, Reflexion) 기존 방식과 달리, 플래너-실행기 모듈을 분리하고 ‘실패 기반 분해(as-needed decomposition)’를 도입했습니다.ALFWorld, WebShop, TextCraft 세 가지 각기 다른 환경에서 기존 SOTA 모델 대비 성공률을 각각 최대 28.3%p, 27%p, 33%p까지 크게 향상했습니다.실행기(Executor) LLM의 성능(GPT-4, LLaMA 등)이나 과업의 고유한 ..
1. 서론 – TaskLAMA 기반 실험 설계 취지SEMO는 복잡한 아이디어를 WBS(Work-Breakdown Structure)로 자동 전개하는 서비스입니다. 이번 연구·개선 계획은 Google Research의 TaskLAMA 벤치마크에서 제시한 과제-그래프 평가 지표 (노드 Hungarian F1, Edge Hungarian F1, Step Proximity 등)를 적극 차용·응용하여, SEMO의 현행 ICL(단일 In-Context Learning) 기반 파이프라인을 체계적으로 고도화하는 것을 목표로 합니다. TaskLAMA는 1612개 과제·12118개 단계·11105개 의존성을 수작업으로 주석해 LLM의 복합 과제 이해 능력을 정량 검증할 수 있는 데이터셋으로, 기존 베이스라인 대비 LLM ..
SEMO 소개일은 세모로.세모와 함께하는 바이브 워킹 SEMO - AI와 함께 만드는 빈틈없는 기획과 시작당신의 아이디어를 SEMO가 실행 가능한 계획으로. 기업가, PM, 프리랜서 모두를 위한 AI 기반 프로젝트 기획 도구www.semo.world 목표·아이디어 입력 → AI가 즉시 업무 구조도를 생성해 단계별 실행 플로우를 제시합니다. 리스트·로드맵·칸반·플로우 등 다양한 뷰에서 계획이 실시간으로 업데이트되어 진행 상황을 한눈에 확인합니다. 클릭 한 번으로 리스크 파악과 우선순위까지 도와주는 ‘바이브 플래닝’으로 실행 가능한 계획을 완성합니다. SEMO Lab 소개‘SEMO Lab 시리즈’는 최신 Task Planning 연구와 SEMO WBS 엔진을 교차 분석하여, 1. 새로운 방법론을 제품에 ..