「あるエージェントが出した答えを、別のエージェント（LLM）が検証する」というアーキテクチャは、検証タスク自体の計算複雑性がLLMの限界を超えるため機能しないか。簡単な実例だと、「LLMに生成させ、別のLLMにチェックさせる」というダブルチェック機構は、タスクが単純な抽出なら機能するが、複雑な論理整合性や最適化問題を含む場合、チェッカー側の計算量的限界により見逃しが発生するリスクがあるってことね。社内のクソシステムの使用実感と合致してる。https://x.com/tjo_datasci/status/2016723181198082051?s=46|新たな発想を生み出す質問箱 Querie.me

質問箱ログイン

13時間前

質問者さん

「あるエージェントが出した答えを、別のエージェント（LLM）が検証する」というアーキテクチャは、検証タスク自体の計算複雑性がLLMの限界を超えるため機能しないか。簡単な実例だと、「LLMに生成させ、別のLLMにチェックさせる」というダブルチェック機構は、タスクが単純な抽出なら機能するが、複雑な論理整合性や最適化問題を含む場合、チェッカー側の計算量的限界により見逃しが発生するリスクがあるってことね。社内のクソシステムの使用実感と合致してる。 https://x.com/tjo_datasci/status/2016723181198082051?s=46

13時間前

TJOさん

雑な論文だというのがぱっと見の感想だが、本質はそこそこいいところを突いている気がするんだよな＞計算量的限界

TJOさんに質問してみましょう！

TJO

Twitterへ

Takashi J Ozaki, PhD / Data Scientist since 2012 / https://t.co/aAyJfWA25u / DVT (treated with Rivaroxaban) / Tweets are totally personal & my own

質問は厳選の上回答します / 回答しない理由は開示しません / お礼など質問ではないコメントは全て拝読の上削除しています / 12時間以上経過した回答ツイートは随時整理されます / 他の人の質問に質問欄で回答する行為は禁止します / 前回アカウント開設時の回答リストは削除済み

TJOさんが