プロンプトが視覚を凌駕する?LVLMの幻覚を解明し対策するHalluVL-DPO
大規模視覚言語モデル(LVLM)でプロンプトが視覚情報を上書きし幻覚(ハルシネーション)を引き起こす問題に対し、HalluScopeベンチマークでメカニズムを解明。HalluVL-DPOが視覚に基づいた応答を強化し、ハルシネーションを抑制する手法を解説します。
動画の時間の流れを学習し、速度を自在に操るAIモデル:スローモーション生成と時間的超解像を実現
動画の再生速度の知覚と制御を可能にするAIモデルが提案されました。この研究は、動画内の時間の流れを自己教師あり学習で捉え、スローモーション生成や時間的超解像を実現。新たな動画編集・生成技術の可能性を開きます。
2026-04-24 AIニュース: OpenAI GPT-5.5公開、MS Copilot自律化、Google新TPUほか
2026年4月24日のAIニュースダイジェスト。OpenAIがGPT-5.5をリリースしAIスーパーアプリへ、Microsoft Copilotは自律エージェントに進化。Googleは新型TPUを発表し、富士通はフィジカルAI戦略を推進。一方で、AIデータセンターの環境負荷も懸念されています。
AIセキュリティ評価を体系化するAVISEフレームワーク:LLMの脱獄脆弱性を自動発見
AVISEフレームワークは、AIシステムのセキュリティ脆弱性を体系的に評価するオープンソースツールです。本記事では、大規模言語モデル(LLM)の「脱獄(jailbreak)」脆弱性を自動で検出するAVISEの活用事例と、その実用的な示唆を解説します。
SpeechParaling-Bench: LALMの副言語情報考慮音声生成を測る新ベンチマーク
大規模音声言語モデル(LALM)による自然な音声生成には、感情やイントネーションなどの副言語情報が不可欠です。この課題に対し、新たなベンチマーク『SpeechParaling-Bench』が登場。従来の評価の限界を超え、LALMの副言語情報生成能力をより詳細かつ客観的に評価する手法を提案し、人間とAIの対話における重要な一歩を示します。
2026-04-23 AIニュース: Google CloudがAgentic Enterprise発表、新TPU登場、Claude Opus評価ほか
2026-04-23のAIニュースダイジェスト。Google Cloud Nextで自律型AIエージェント構想と第8世代TPUが発表。Claude Opus 4.7の性能と利用状況、AIによるセキュリティ脆弱性検出、企業におけるAI活用事例を深掘りします。
AIキャッチアップの時間を、 ほぼゼロに。
英語で書かれた研究論文や海外のAIニュースを読むのは時間がかかります。 AI Frontier は、そのハードルを下げるための実験的プロジェクトです。毎日公開される3本の記事から、あなたの関心に近いものだけ拾い読みしてください。
もっと詳しく