如果说过去两年AIGC解决的是“怎么做广告”的问题——更便宜、更快地产出素材,那么现在AI智能体正在解决的,是“在哪投、怎么投、投给谁”的运营决策问题。今年来,Audion、ENCO、Spotify、亚马逊接连发布AI音频广告的新能力,从人工选平台、手动定预算、看复盘数据再做下一轮调整,到系统基于实时信号自动匹配、动态优化,AI在音频广告中的应用,正在从“内容生成工具”升级为“广告运营智能体”。
一、从“人判断”到“智能体决策”
今年2月,欧洲数字音频广告公司Audion率先发布了Audion AI,用AI智能体完成广告策划和投放优化的全流程。具体来说,广告主只需输入一个简单的目标提示,Audion AI就能自动将它拆解为可执行的投放策略,实时扫描Spotify、Deezer、Apple Podcasts、YouTube、Amazon Music等音频和视频平台上的海量内容,识别出最相关的投放位,并基于历史数据和品牌提升研究预测内容表现,在预算支出之前就做出最优决策。在投放过程中,系统还会根据实时的交付和响应数据持续优化,把预算动态调整到效果最好的环境中去。
Audion的创始人Arthur Larrey在采访中说,音频广告不只是一个品牌认知渠道,它完全可以驱动可衡量的商业效果。这套AI智能体的目标,就是让预算从“假设性触达”转向“验证性表现”,让每一分广告投入都变得更可测量、更可问责。
这类能力已经在市场上获得验证。就在4月,Audion完成了1500万美元的B轮融资并正式进入美国市场。用AI智能体做跨平台的广告决策,已经从“行业畅想”变成了被资本和市场同时认可的业务模型。
二、生成门槛一降再降,甚至无需人工干预
智能体负责决策,而内容生产端,AI同样在加速进化。ENCO在NAB 2026展会上展示了其SPECai平台的重大升级,把音频广告的创意生产门槛降到了几乎可以忽略不计的程度——用户只需输入一个品牌网址,InstaSpot功能就能自动生成带完整脚本、多声线配音和音乐背景的广告成品。最新版本还新增了多声线和情感控制能力,广告中多个角色的语气可以分别调节,加上内置的音效和语音转语音技术,让AI生成的广告在听感上几乎和真人配音没有区别。不仅如此,ENCO还推出了SPOTai,一个基于同一技术逻辑的视频广告生成平台,让音频广告的素材可以一键转化为视频格式,覆盖电视、社交媒体等多个渠道。
更值得关注的是,ENCO还演示了动态内容插播技术,可以将实时信息(比如天气、新闻、促销活动)插入已经录制好的音频节目中,让广告内容始终保持时效性。当生成成本趋近于零,广告就可以做到“每个受众听到的版本都不相同”,音频广告的定制化程度正在进入新的量级。
三、平台侧也在用AI重新定义“音频广告”
Audion和ENCO是从广告技术和制作侧切入,而平台方则在直接改变用户体验的底层逻辑。
Spotify在今年5月的投资者日上发布了一系列围绕AI的重磅更新,包括Personal Podcasts(根据用户提示词生成个性化播客内容)和实时AI问答功能。这些功能让音频从“单向广播”变成了“双向对话”,有数据显示,85%的广告主对对话式音频格式表示感兴趣,在生成式AI的加持下,音频正在变成一种新的对话界面,用户从“收听者”变成“互动者”。
亚马逊则在5月为Alexa+上线了Alexa Podcasts功能,用户只需说一句“帮我做个关于XX的播客”,Alexa就会自动完成研究、大纲和AI主播播报。亚马逊还与美联社、路透社及全美200多家地方报社建立了信息合作,以提升AI生成内容的准确性和可信度。这意味着,品牌可以通过Alexa等智能助手,以更低成本快速生成符合自身需求的品牌播客、产品科普等营销物料,将音频内容的生产变成一个可规模化、可定制化的流程。
四、规模与信任的平衡
当然,AI音频广告的快速增长也伴随着新的挑战。IAB Australia在其2026年音频行业报告中发现,虽然广告主对AI在效果追踪和实时优化上的作用高度期待,但也有53%的广告主对AI在音频内容制作中的应用表达了担忧,尤其是主持人真人声线的克隆和AI生成内容的真实性问题。这也是为什么亚马逊选择与权威媒体合作来提升内容可信度。
与此同时,程序化音频广告的市场规模正在持续扩大,预计2026年将达到22.6亿美元,成为数字广告中为数不多保持两位数增长的品类之一。Comscore的报告也指出,音频和联网电视是仅有的两个程序化预算保持同比增长的媒体渠道。越来越多的品牌开始将音频广告视为不只是“补充曝光”的渠道,而是一个具备数据驱动、可优化、可衡量的核心经营阵地。
