13時間前

質問者さん

「あるエージェントが出した答えを、別のエージェント(LLM)が検証する」というアーキテクチャは、検証タスク自体の計算複雑性がLLMの限界を超えるため機能しないか。 簡単な実例だと、「LLMに生成させ、別のLLMにチェックさせる」というダブルチェック機構は、タスクが単純な抽出なら機能するが、複雑な論理整合性や最適化問題を含む場合、チェッカー側の計算量的限界により見逃しが発生するリスクがあるってことね。社内のクソシステムの使用実感と合致してる。 https://x.com/tjo_datasci/status/2016723181198082051?s=46

13時間前

TJO

TJOさん

雑な論文だというのがぱっと見の感想だが、本質はそこそこいいところを突いている気がするんだよな>計算量的限界

TJOさんに 質問してみましょう!

Takashi J Ozaki, PhD / Data Scientist since 2012 / https://t.co/aAyJfWA25u / DVT (treated with Rivaroxaban) / Tweets are totally personal & my own

質問は厳選の上回答します / 回答しない理由は開示しません / お礼など質問ではないコメントは全て拝読の上削除しています / 12時間以上経過した回答ツイートは随時整理されます / 他の人の質問に質問欄で回答する行為は禁止します / 前回アカウント開設時の回答リストは削除済み

TJOさんが

最近答えた質問

51秒前

爆発しないナトリウムイオン電池が市販されてるから、早めに交換するべ

6分前

このマンガか https://www.kodansha.co.jp/titles/1000000122

6分前

https://news.livedoor.com/article/detail/30474923/ リチウムイオン電池は身近に使われてる割に結構危ない