“桃花潭水深千尺,不及汪伦送我情”这是唐代诗人李白描写的一段与友人汪伦深厚情谊的诗篇,而桃花潭就位于安徽泾县。你能想象这样一副画面,当你夏末秋初来到晨雾弥漫的桃花潭,用手机录制下一段美景,再让大模型给你编制一段散文,瞬间整幅美景都活灵活现起来。在8月15日的讯飞星火大模型V2.0发布会现场,讯飞研究院院长刘聪就用星火“临场”编制了一段描写桃花潭美景的散文,再配上风景如画的视频,让在场观众心驰神往。
这背后,得益于讯飞星火V2.0在多模态能力上的进化。在发布会上,刘聪全方位演示了讯飞星火V2.0在图像描述、识图创作、文图生成以及虚拟人合成等方面的强大能力。当用户旅游时拍下一张张精美绝伦的照片,匮乏的辞藻已不足以表达,此时可以打开星火APP,让大模型补充一段“应景”的唯美描述,这才是发朋友圈的正确姿势。
除了有趣的识图作赋,讯飞星火V2.0还基于多模态技术打造了全新的讯飞智作2.0,这是一个功能全面的AIGC内容创作平台,用AI孵化每个创意,让内容创作者轻松拥有专属AI创作助手。在如今短视频风靡的年代,视频创作者被称为“全能王者”,他们同时要兼具文案、配音与剪辑三项技能。对于普通人来说,这些高门槛的“技术活”足以将自己拒之门外。
但是有了讯飞智作2.0,一切变得迎刃而解。它支持AI后期制作、创意视频生成、专属声音定制,还可以让照片“说话”,为你在数字世界打造虚拟分身。以打造一段创意视频的流程为例,用户只要写上一段创意描述,比如“我想为自己的家乡制作一部宣传片”,然后上传家乡的美景与美食,再选择通用模板、设置单语或双语字幕,最后挑选一个AI主播。不一会儿,一段媲美真人入镜,声情并茂介绍你家乡的视频就制作完成了。然后将视频发给自己的家人或通过短视频渠道分享,你也能秒变“专业范”十足的视频创作者。
如果将目光放在更高的维度,多模态能力也是赋能千行百业的刚需。据悉,讯飞星火V2.0多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域,通过从真实世界获得越来越多的数据,经过学习、训练与提升,最终反哺产品终端越来越智能,越来越聪明。诸如讯飞智作2.0提供的虚拟人主播,讯飞语伴2.0提供的虚拟人老师等能力,都是多模态能力不断跃升的产物。
从长远来看,讯飞星火大模型解放多模态内容生产力,将有力推动AIGC产业的发展,开启“人人都是创作者”的新时代。如果你有意投身内容创业大潮,现在就可以通过星火APP、讯飞智作PC端等产品,率先体验基于多模态能力的众多新功能。或许你,就是最有天赋的内容创作者!