モデルtldr-ai2026-05-21
WavFlowが動画から直接音声生成
WavFlow Generates Audio Directly in Waveform Space (GitHub Repo)
Meta AIのWavFlowは、動画や文章から直接音声を生成するAIです。音声圧縮なしで自然な音を作れるため、AI音声生成の質が向上します。
WavFlowはMeta AIによるflow-matchingフレームワークで、latent audio compressionに頼らず、動画やテキスト入力から生のwaveform spaceで直接同期した音声を生成します。