“直播间送福利了,炸串豪华套餐仅需19.9元。”2月28日,南京一家炸串店视频直播间里,带货主播正在卖力吆喝。但令人意想不到的是,这名外表和声音与真人无异的主播竟是一名数字员工,完全由电脑采集生成。在人工智能生成内容(aigc)技术加持下,数字人与真人的相似度越来越高,甚至替代了一部分人的工作。aigc将给人们日常生活和我省产业布局带来哪些革新?《科技周刊》记者多方探访。
□ 本报记者 张宣 程晓琳
近200万个ai数字人“上岗”直播
aigc,即利用人工智能技术自动生成内容,包括文字、图片、音频、视频、代码等。
“aigc红极一时,绝不是一蹴而就,而是多年来数据集的积累,厚积薄发的力量。”南京星蝠科技有限公司ceo魏佳星告诉记者,过去传统人工智能偏向分析能力,而现在人工智能已经进化到生成新内容,通过大量的训练数据和生成算法模型,自动生成文本、视频等。而aigc代表ai技术发展的新趋势,带来智能数字内容孪生能力、编辑能力、创作能力等内容创作的新变革。
在视频成为信息主要表达方式的当下,视频内容的ai自动生成超越语音、图像等,成为aigc的除chatgpt以外的主要关注方向。在南京硅基智能科技有限公司,记者看到了许多和真人相比难辨真假的ai数字人。普通人只需要提供一段3—5分钟的真人口播视频,在aigc技术下,仅需十几分钟时间就可生成一个超高拟真度的数字人主播。“在我们的凯发k8官网的技术支持下,已有近200万个ai数字人‘上岗’,它们能代替真人出镜拍视频做直播,单次最长直播时长纪录可达400小时。”硅基智能创始人司马华鹏介绍,ai数字人的技术难点在于其核心“大脑”部分,依赖自然语言处理技术实现与人的高仿真交互。
记者在现场看到,ai数字人的嘴型、动作和表情高度匹配,这是如何做到的?司马华鹏解释,这是硅基智能在行业内领先的技术,同步效果要在对话中实时推理完成,对算法和算力的要求非常高。“只有同时具备自然语言处理、语音识别和生成、视觉合成的整体ai能力,才能给用户自然逼真的体验。在硅基ai驱动技术和华为鲲鹏引擎的双向加持下,打造超级人工智能算力,为高性能计算、数据库、云计算等应用场景的工作负载进行高效加速,可广泛应用于视频制作、直播、多模态交互等场景。这是我们的核心竞争力。”
“aigc站上风口,主要体现在其‘逻辑性’,也就是除了捞取知识库回答问题,ai已经可以通过推理判断,进行自己的知识体系升级,给出自己独立思考后产出的结果。”图灵人工智能研究院总经理李强认为,“目前ai赋能内容生产在插画、设计、医疗、教育等行业,ai通过自学习,已达到行业标准并向外输出。”
御风而行,aigc将给产品带来哪些革新?“只要有想象力,普通人也可以制作出类似‘阿凡达’的大片。”李强告诉记者,aigc将解放人类的双手,目前图灵人工智能研究院重点聚焦人工智能图像生成,已经开发了“小灵绘画”和“ai画灵”两个产品,用户基于ai算法,只要输入关键词或者一段描述场景的文字,便可在几秒内生成一张符合意境的图片,无论浮世绘或是赛博朋克,梵高或是毕加索。
魏佳星则认为,智能客服产品需要强大的计算能力快速处理大量数据,而aigc拥有巨量的语言模型,且其自然语言生成技术可以生成更人性化的回复,两者结合,客户将能够得到更快速的响应,以及更准确的答案。
数字“造人”赋能产业升级
《中国互联网发展报告2022》公布的数据显示,江苏省人工智能领域核心企业超过1000家,人工智能相关产业规模超过2000亿元。江苏人工智能产业正积极抢抓国家新一代人工智能示范应用战略机遇,持续加强人工智能基础层、技术层、应用层等全产业链研发部署。在《2021—2022中国人工智能计算力发展评估报告》中,南京、苏州分列中国人工智能城市排行榜上第四名和第六名。aigc在我省落地情况如何?
“我们用ai技术造人,可为各行各业输送大量数字劳动力。”司马华鹏告诉《科技周刊》记者,目前人类从事着许多重复性的脑力劳动,数字人打造人类“数字分身”,帮助企业数字化转型。硅基智能研发的数字人产品,目前已应用于数字人主播、数字人客服、数字人医生、数字人教师等各类场景。aigc大幅度降低了数字内容生产的成本,打破了数字内容生产受到人类想象能力和知识水平的限制。
如近期南京市商务局启动“南京百万数字人创业计划”,依托“ai数字人”技术将数字人在直播、短视频方面的数字化优势融入线下消费场景,可实现7×24小时全天候直播,为小店发展降本增效、聚客引流,推动实体小店智能化改造、数字化升级。“我们力争一年内打造约20万个数字人,服务约2000家企业;3—5年内打造约100万个数字人,用ai技术赋能传统行业。”
aigc内部技术协同也为其应用落地提供了更多“破题思路”。魏佳星告诉记者,云蝠智能ai外呼和数字人产品之间正在考虑形成一种协同效应。他解释,两者协同工作时,云蝠智能ai外呼可以帮助企业快速接通客户电话,数字人产品可以与客户进行人性化的沟通,推荐符合客户需求的产品和服务,解决客户的问题,实现更加精准的市场推广。
李强说,相信aigc会对所有内容生成相关的行业产生深远的影响,在文化、金融、医疗、安全、教育等领域都大有作为,例如虚拟直播人、汽车人机交互、虚拟老师、ai问诊、智能客服、语言翻译等,应用场景非常宽泛。另外,随着aigc技术与行业的深入融合,又会催生出很多新的市场需求,例如,对制造业数字化转型及数字政府建设产生进一步驱动力,“而江苏内容生态市场空间广阔,政府随着人工智能行业的不断发展,对政策内容也持续进行细化,从顶层设计至创新成果转化路径,再到技术层面都有相应政策指导,未来路径更为清晰。”图灵人工智能研究院已经在相关领域开始布局。
爆发态势的aigc距顶峰还有距离
aigc已经可比肩“类人智能”了吗?李强的答案是,技术的发展往往是爆发式的,也许当前aigc的这次爆发还仅仅只是开始。他举例,现在爆红的chatgpt作为aigc概念下衍生出的一个模型工具,当下的技术发展还未达到数字永生的程度,未来还未可知。目前虽然chatgpt实现了文本生成的部分场景的“可用”,但远没有达到完全的“可信”,在不擅长的领域,chatgpt会“一本正经地胡说八道”。
据悉,目前chatgpt背后的gpt3.5大模型,参数大概1750亿个,而人脑拥有近1000亿个神经元和100万亿个连接,模型的参数量级还远没有达到人脑的突触数量级。并且,aigc模型需要大量数据参与训练,因此对算力基础设施有较高要求,这使得头部企业的规模优势更加突出,腰部企业有被“腰斩”的风险。
近期,各类aigc产品呈井喷式出现。李强提醒用户,过度依赖自动生成内容可能导致内容缺乏多样性或原创性,也无法拥有批判性、共情力,所以将其作为辅助工具,用来帮助信息搜集、信息梳理、谋篇布局成为最优选。
人工智能算法真的能做到公平、公正、无害吗?aigc带来技术红利的同时也带来了造假、侵权行为泛滥、信息茧房、算法歧视等多重风险。目前,部分开源的aigc项目对生成的图像监管力度较低,数据集系统利用私人用户照片进行ai训练,制造虚假音视频图像进行诽谤、诈骗、勒索等违法行为已屡见不鲜。此外,一些用户利用aigc制作出暴力和性有关的画作,一些平台已经开始进行伦理方面的限制和干预,相关法律法规也有待进一步完善。
对此,构建开放有序的aigc生态尤为重要。李强认为,应鼓励各方加速共性技术和基础产品研发,重视人工智能技术标准的建设、产品性能与系统安全的测试,积极参与aigc应用、治理、完善等领域的国际规则制定和全球发展合作。另外,提升关键技术方面,在算法技术、ai工程化等方面加强攻关,以突破算法透明度、鲁棒性、偏见与歧视等技术局限,不断打磨推出更为安全、可信、可靠的人工智能技术产品,打破技术瓶颈。
图灵人工智能研究院也在加速ai内容审核和防篡改能力的升级,前者可以对违规违法的图文、视频甚至是直播信息进行自动审核、过滤,后者基于深度学习和端到端强化学习技术,可以对图片、文字的真实性进行鉴定。业务方的测试和实跑数据显示,在身份证复印件、门头照、执照复印件、特殊资质等文件类型上已达到行业最高标准,针对单张图片的篡改检测可以在1秒内完成。
“技术的进步带来身体的延展,借ai之力,人的有限性得以拓展和超越。探索用主流价值导向驾驭‘算法’,为大众提供更具情感温度和人文关怀的信息服务,是人工智能时代的应有之举和努力方向。”李强说。
更多资讯或合作欢迎关注中国经济网官方微信(名称:中国经济网,id:ourcecn)