LLMエージェントの推論時学習を実世界へ:マルチデータセット対応「EEVEE」の革新性
LLMエージェントが実世界で直面する多種多様なタスクストリームに対応するため、EEVEEは推論時プロンプト学習にルーターと協調進化戦略を導入。複数データセットで堅牢性と性能向上を示し、SOTAを上回る成果を達成しました。
大規模言語モデルのSFT最適化を再考:ターゲット分布設計で性能向上を実現する「Target-SFT」
大規模言語モデルのスーパーバイズドファインチューニング(SFT)におけるone-hotターゲットの限界を解決する「Q-targetフレームワーク」が登場しました。本研究はSFTをターゲット分布設計として再解釈し、提案手法Target-SFTは複数の推論タスクで性能向上を達成。SFTの最適化に新たな視点を提供します。
2026-06-10 AIニュース: Apple Siri刷新、Google Gemini 3.5翻訳、AI自己改善の警鐘ほか
2026年6月10日のAIニュースダイジェスト。AppleがWWDCでSiri AIの抜本的刷新とプライバシー戦略を発表。GoogleはGemini 3.5のリアルタイム翻訳機能を公開。AnthropicはAIの「再帰的自己改善」によるリスクに警鐘を鳴らしました。最新のAI技術動向と業界の課題を解説。
強化学習の学習効率を最大化:ベースラインポリシー活用とAgency-Transferringによる性能向上
本記事では、強化学習(RL)の学習効率と性能を向上させる新手法「Agency-Transferring」を解説。既存のベースラインポリシーを活用し、初期から高い目標達成率を維持しながら、最終的にベースラインを超える自律的な学習ポリシーを効率的に獲得する技術の核心と実用への示唆を詳しく紹介します。
VLMゲームエージェントの進化を測る:UE5統一ベンチマーク「OmniGameArena」と改善動態曲線IDC
VLMゲームエージェントの評価は、これまでの単発スコア報告から脱却します。Unreal Engine 5製統一ベンチマーク「OmniGameArena」と、自己改善プロセスを測る「Improvement Dynamics Curve (IDC)」が、エージェントの学習能力と汎用性を詳細に分析し、AI研究の新たな道を拓きます。
2026-06-09 AIニュース: OpenAIがIPO申請、AppleのSiri AI刷新、Anthropicの警告ほか5件
OpenAIがIPO申請を機密裏に行ったことが報じられました。AppleはWWDCで「Siri AI」と「Apple Intelligence」を発表し、AnthropicはAIの再帰的自己改善について警鐘を鳴らしています。主要なAI業界ニュースをまとめてお届けします。
AIキャッチアップの時間を、 ほぼゼロに。
英語で書かれた研究論文や海外のAIニュースを読むのは時間がかかります。 AI Frontier は、そのハードルを下げるための実験的プロジェクトです。毎日公開される3本の記事から、あなたの関心に近いものだけ拾い読みしてください。
もっと詳しく