天工AI支持文字■★■◆◆◆、图片■★★★◆、声音、视频、文档处理等,是第一个真正意义上的多模态AIGC产品■◆★◆★。可能很多用户对多模态是什么不大了解,其实多模态就是更自然更好用的人机交互,因为人可以任意多种形式(文字、图片◆★、声音、视频)与机器交互◆◆◆★★,就像跟人和人交互一样自然。
此前ChatGPT等大模型应用因结果过时被诟病——很多大模型预训练数据是一年前半年前的,因此输出的结果无法与时俱进,不可用。天工AI则是国内唯一能够支持实时天气■■★■、股市、星座运势等信息查询的AI产品,能够同时生成特定卡片和对应文本分析,满足用户的高频需求。
特别值得一提的是★★◆◆■■,天工AI音乐不只是创作工作◆■◆★■,也是AI音乐分享与发现社区,AI创建的歌曲可一键投稿到平台,参与相应的激励活动,说不定哪天你也可以作为AI kol在天工上变现了。
第三是竞争激烈。虽然天工AI已占据AI搜索的先发优势,但AI搜索以及AI助理已被行业看好,微软★★■★★■、谷歌★■■★◆■、Meta以及国内的百度、字节等巨头均押下重注。天工AI被市场验证的一些产品形态★■,也正在被巨头们跟进。因此,天工AI要持续保持先发优势绝非易事◆◆。
移动互联网的普及微信功不可没,天工AI在AIGC走向亿万用户中也将发挥一样的作用■■◆■◆◆,其将极大地降低AIGC应用的使用门槛,也将有望成为通用型AI时代的超级应用★★★■◆,成为“AI时代的微信”。
更超出我预期的是,天工AI的增强搜索还支持★■◆◆★“追问■◆★◆”◆◆,当我再问“哪一种签证更快,适合紧急出行★◆■”时,它同样给出了准确的答案,堪比专业导游:
「天工SkyMusic」是中国首个音乐SOTA模型,在人声&BGM音质、人声自然度、发音可懂度以及综合评分上超过AIGC音乐鼻祖Suno V3,这是中国自研大模型技术第一次在AIGC领域领跑全球。
去年8月天工AI发布了中国第一款AI搜索产品,引发四面八方的AI产品扎堆搜索领域。随着谷歌发布Genimi demo,可能就连昆仑万维都没想到AI搜索会成为全球AI大战的★■◆★★◆“炸子鸡”应用。
其次,AI基础技术强。2023年4月★■■■★◆,天工skywork首款国内自研大模型上线,与文心一言、通义千问、讯飞星火并列前四,是国内第一批双千亿级大模型;2023年9月,昆仑万维推出多模态大模型Skywork-MM,在多模态大语言模型测评MME中综合得分排名第一;AI产品化早。早在2019年昆仑万维就已在全球布局AIGC◆◆◆,在海外有多款成熟AI产品★★★◆★;
我是重庆人,喜欢吃面食★■◆★◆,我让天工AI帮我对比一下重庆小面与兰州拉面,它直接提炼出了对比表格,图文并茂◆★★◆■★,结果超预期。我特意去看了参考链接里面的内容,都没有对比表格,可见这表格是天工AI自行提炼的结果◆★◆。
在写作时◆■★◆★,我经常需要阅读一些专业报告并快速提炼出信息■◆◆■★,这是让人十分头疼的活儿◆■★,因为阅读一份报告需要很长时间■■◆■■,甚至比写稿本身的时间更多。使用天工AI的文档解析功能★■◆★■,我可以快速得到文档梗概重点,且可以生成脑图,这比传统目录更一目了然■★■◆◆。
ChatGPT、文心一言等大模型助理也可以回答以上问题,天工AI还有什么看家本领呢?
在全球范围内★★■■★■,AIGC产品百花齐放,ChatGPT★■★■◆◆、Midjourney、suno◆■★★、Copilot■◆、kimi■■、文心一言……有的擅长对话聊天,有的深耕办公场景,有的专注长文本。但对用户来说■★★,不同类型的AIGC产品分散各处★◆★,需重复注册与付费,要解决一个问题则需在不同应用间切换,要用好AIGC往往需要系统的学习培训,这在无形中影响了大模型应用的普及。
比如我在计划去越南旅行时,在天工AI输入★◆◆◆■★“越南旅游”这样的模糊需求时★★★■◆◆,它会推理我可能的需求◆◆■◆,问我是想了解签证还是航班抑或是酒店◆■◆■◆?(图左)。当我明确要查询越南签证办理方式时■◆★,它给出了准确的总结(图右)。
让每个人都能创作歌曲的Suno一度很火,但Suno AI已开始收费■★◆★◆,天工AI则支持免费创建音乐,且体验更接地气■★■,支持选择不同曲风与情绪,一次可生成三个版本,均可免费下载★◆★。
除了可以解析PDF等文档外★◆★■★◆,天工AI生成PPT的能力也不俗,比如我最近准备在公司内部展开一个新媒体内容风控的培训,它直接给我生成了一个框架,我还可以选择不同模版一健生成PPT■★★■,整个过程不到两分钟,基本覆盖我要培训的维度,我根据个人经验补充对应内容即可★★★◆。
那么■◆,天工AI能力到底如何◆★■■★★?作为一家新媒体机构的创始人,我每天的工作都有大量场景需要使用AIGC,我发现常见的AI需求在平台都有对应的服务可以满足,而且完全免费。
传统搜索引擎要求用户只能输入数十个字★◆■■,天工AI支持长文本输入,且可以给出更加清晰的答案,比如我让天工AI与百度分别做一个数学题,天工AI不只是得到了正确答案,还给出了解题思路和延展问题建议:
刚好雷科技今天的推文是关于微软AI PC的◆■◆★,于是我试着让天工AI帮忙制作一张封面图:
不过,相较于纯文字而言,小红书用户习惯看图文结合的内容,于是我试着让天工AI给我生成一张iPad Pro的画报用于笔记。
从网站◆◆★■◆■、App主界面来看◆■◆,天工AI平台集成了AI搜索、AI文档分析、AI画画、做PPT、音乐生成、视频转绘、AI写作★■★■◆、AI语音对话等主流AIGC应用,本质就是一个AI应用的超级平台。
更强大的地方是,天工AI还能精准回答“手机相关内容在报告哪一页”这样的内容,我写稿要用到对应内容直接到对应页码精读即可★★■■◆,当然如果你不想自己精读,天工AI也支持一健AI速读。有一说一★◆◆■,天工AI的文档解析确实可以大幅节省编辑、记者、公关、研究员、分析师等人群的时间。
当前市面上出现了不少AI搜索引擎,但要么是自研大模型+套壳搜索引擎——其中大多是微软Bing接口,随时可能被掐断,要么是套壳大模型+自研搜索引擎,甚至还有大模型与搜索引擎都是“套壳★◆■★◆■”的,只有百度、字节和昆仑万维的天工AI走的是大模型与搜索引擎★★◆◆■★“双自研”路线。
在白云机场■■★,我拍摄了一则机场忙碌景象的小视频,想用来制作旅行Vlog。将视频上传到天工AI后,我只需指定★■◆◆“日漫”风格,它就能生成一则格调别致的小视频,还挺带感的:
除了前面的图片生成功能,天工AI最近还上新了一个宝藏功能【AI视频转绘】,只需上传或者拍摄一段小视频,天工AI就能生成很多不同风格的视频■■◆★★★,比如动漫、迪士尼等二次元风格,这个功能可太适合内容创作者了。
在消费级市场,也有在潜心做大模型产品的玩家■★■,其中来自中国的昆仑万维——天工AI就蹚出了一条自己的路★★■■。5月27日★■◆■★◆,昆仑万维宣布,天工AI APP日活用户(DAU)已超100万,成为极少数进入“DAU百万俱乐部”的消费级AIGC应用,QuestMobile数据则显示■◆◆,其月活量已逼近千万。作为大模型C端应用的全能型选手,天工AI体验到底如何★★■★?
结果也不错,画面简洁大方,颜色明亮鲜艳,还真有一点我要求的“金属质感”■◆◆★。
天工AI让AIGC产品碎片化的问题迎刃而解。集成如此多AI功能★◆◆■■、支持多模态的消费级AIGC平台,也只有天工AI一家,说其是“大模型孤品■■”不夸张■■◆★◆◆。
在启动天工AI的“增强模式”后,我体验到了一种前所未有的★■■■“增强搜索”★★■◆■:它可以对我的复杂需求进行拆分再推理,通过引导提问摸清楚我的需求,再整合全网海量内容给出我最需要的结果。
我的工作需要关注所有科技行业的发布会日程,团队小伙伴每个月也会手工制作科技行业活动日历■★■★■◆,我试着让天工AI帮我做这件事情◆■,Bingo!它给出的答案竟然全部正确,信息整理能力完全不输实习编辑,且还贴心地给出了“参考链接”让用户二次确认。
答案让人惊喜★★◆★,天工AI不只是准确地把握了iPad Pro的特性◆◆,而且可结合小红书笔记文风加入表情◆◆■◆★◆,且每一个表情都不是随意添加的。在文末,天工AI还加入了对小红书推荐效果影响很大话题标签◆★,这份文案给人感觉很“走心”,90%可用。
前些年我们新媒体从业者最担心被图片版权机构敲诈勒索◆★■,现在有了天工AI,微信推文的封面图可以自己做了,感觉每年都可以省下一大笔钱了。
自天工第一款AI搜索产品上线个月,现如今的天工AI俨然已升级为AI搜索为主的多模态全能AI孤品。
最后◆◆◆◆★■,布局AI搜索最早★◆★■。2023年天工AI推出AI搜索,率先构建多模态的搜索能力并延展成全能AI助手,在产品完整度◆■◆★★■、体验与技术上均已形成先发优势■◆◆。谷歌在I/O大会上展示的■★■“炸裂级★■”AI搜索能力均是吃天工AI的“剩饭”,多模态搜索★■◆◆◆、图文并貌的结果以及搜索增强理念,天工AI早已具备,且还拥有结果实时性、中文理解能力等差异化优化◆★。可以说,天工AI搜索已具备世界级竞争力■★■★★,其将有望在新一轮的搜索大战中脱颖而出,换道超车。
取代QQ的不是飞信而是微信,颠覆淘宝的不是京东而是拼多多。虽然ChatGPT曾被视作将颠覆谷歌◆■★,但从产品形态与市场反馈来看,针对搜索进行特定设计与优化的AI全能助理,将更有希望赢得下一轮搜索大战。
大模型给搜索带来的变革更加彻底■■◆■★,AI搜索也成了谷歌■◆■、百度等巨头的关注点,而在巨头外◆■■★,还有AI搜索鼻祖【天工AI】这种基于自研大模型和自研搜索引擎的实力派产品。
AI搜索比拼的是大模型的真实世界认知能力与搜索的产品化能力,赢得AI搜索大战的一定是◆■★★“双自研”的玩家。而在屈指可数的“双自研”玩家中★◆◆■,天工AI已构建独特的优势★◆◆■:
搜索引擎建立在数据■■◆、知识与算法基础之上,与AI有着密切的关系,在深度学习阶段,谷歌、百度等搜索巨头就曾是主力玩家。
第一是商业模式。当前天工AI可免费无限次使用,AI搜索结果纯净无广告,暂未商业化。此前Google母公司Alphabet董事长John Hennessy曾表示,基于大型语言模型的搜索的成本可能是标准关键词搜索的10倍◆■◆◆◆,如今大模型成本指数级下滑,但AI搜索商业化仍是行业待解难题,其结果高度精准■★◆★◆◆,很难再像传统搜索一样在结果中插入广告。
从AI全能助理角度看,天工AI是AIGC时代的消费级超级应用平台,堪称AI时代的微信;从AI搜索的维度看,天工AI则有望成为AI时代的谷歌。不容回避的是★◆◆■■,天工AI依然面临一些挑战:
而且跟微信一样,天工AI将AIGC的使用做到了前所未有的简单★◆:我体验的所有功能都是免费的★◆■◆■,没有使用次数等额度限制◆★◆★◆,而且连注册登录都不需要◆★■■。
刚好我最近接到了一个体验2024年新款iPad Pro的任务,这个任务串联了天工AI的不少核心功能■◆◆◆■◆,给大家分享下我的实操案例。
第二是内容生态。算法与内容是搜索的基础。PC时代◆◆■■◆◆,基于入口地位与“爬虫”协议,搜索引擎不缺内容◆◆;移动时代,腾讯、字节通过超级App聚拢海量优质呢日,百度一度因内容匮乏“无源可搜◆★■■■■”★★◆■,因而不得不战略布局百家号、并投资知乎■■★★■、快手等平台来充实内容生态;AIGC时代★★◆■◆,内容(包括人工创作内容与AIGC内容)同样是互联网的基石,天工AI基于Opera等业务有一定的内容生态积累■◆◆■◆★,但当前结果也依赖对全网内容的聚集◆■◆,其需要对内容生态进行前瞻布局。
2023年8月,天工推出中国第一款AI搜索产品——天工AI搜索,如今AI搜索依然是天工AI的核心功能。天工AI的搜索界面◆◆★,跟百度、谷歌等传统搜索引擎截然不同。作为AI搜索引擎,其支持简洁、增强和研究等不同搜索模式。“搜索框”变大了不少◆◆★◆■,这是因为用户使用天工AI不再需要学习Query等搜索技巧,可直接用自然语言输入任何需求。
大多数AIGC应用目前还只通过PC WEB页提供服务,天工AI则支持PC◆★■、App■◆、小程序等多渠道■★★,让用户在不同场景可随时随地免费试用★■◆■:
其实ChatGPT最初最被外界看好的也是“下一代搜索”,不过它想做全能AI助理,看上去什么都可以做★■★◆■◆,但却没有针对搜索、问答、文档解析★★★■■、漫画◆★■◆★■、音乐等等场景进行优化★■★★◆。结果就是,在搜索上,ChatGPT存在训练数据与结果过时的问题,搜索结果存在较大不确定性,体验很不完整。反倒是天工AI,针对AI搜索进行针对性的设计优化◆★■★★◆,推出搜索增强模式★■,提高结果时效性,支持多模态交互,免费零门槛使用,快速构建了先发优势,在巨头入局AI搜索时构建起■★◆“人无我有◆◆、人有我强”的优势。
首先■◆◆■◆★,搜索基础好。天工AI出自昆仑万维,依托Opera等业务有着多年的内容与搜索服务沉淀◆■◆★;
体验后我觉得天工AI算得上是真正意义上的全能AI助理★■。在搜索、写作★★◆、对话、文档分析、画画、音乐生成等基础能力外,它通过智能体整合AI PPT★◆◆◆、翻译◆★、百科、口语陪练◆■◆■、旅行规划★◆■、内容推荐、编程助理、AI识图、漫画、数据分析等应用,实实在在地帮用户解决工作、生活与学习中的诸多问题。
AI大模型本质是真实世界模拟器,其具备极强的认知能力,可更准确地理解用户需求、更自然地与用户交互、更好地理解内容,进而可对搜索结果进行整理★◆◆★★、组合◆■★、过滤、筛选◆■★◆■、排序乃至再创作等◆■“增强”,基于此,用户不再需要在大量搜索结果中再筛选比对,而是可一步到位得到所求。AI搜索引擎比拼的将不再是“排序”,而是“需求理解、内容认知与结果生成”的综合较量◆◆■■◆。
比如我最近在关注贵州茅台◆◆★■,天工AI可给我最新的股价数据■◆◆◆◆,且通过卡片展示K线图:
在前几天的Google I/O上,谷歌展示了Gemini可以给用户规划旅行计划、给出健康食谱,这被一些媒体报道成是很■★■■◆“炸裂★◆”的成果,其实天工AI早都实现了,且做得更好,比如针对我的越南旅行,天工AI除了可以回答签证等专业问题外,也能给出具体的行程规划,图文并茂,路线科学,基本可直接用:
这个图剪裁一下就可以用了——美中不足的是logo成了苹果的,但瑕不掩瑜。
微信在移动时代扮演着“超级App”的角色★★◆■,它像一个超级容器,基于小程序等应用形态,让用户可在平台内通信★★◆◆■、社交、阅读、开会■■★◆,还能玩游戏、支付理财◆■、订机票、点外卖、购物。同样■◆,天工AI也是一个真正的多模态AIGC应用平台,在这里用户可一站式获取所有主流AIGC服务■★★◆★,无需在不同App间跳转就能解决生活与工作中的诸多问题。
据了解,天工AI音乐生成大模型是完全自研的,当前AIGC音乐在国内外都没有公开可用的开源模型,suno也没公开任何技术架构。天工AI音乐生成在4月17日上线时,就对外公开了技术架构。
随着成本快速下降,大模型全面普及的拐点已经到来。不过,大模型价格战面向的是B端开发者的★■,对大多数C端用户来说★■,大模型依然在“只听其声不见其面”阶段■■◆★■■,ChatGPT这一AIGC应用鼻祖成了■◆★■■◆“玩具”■◆,Sora这样的明星产品无法体验◆◆。
天工AI让人惊喜的功能,不只是图片生成和AI视频转绘★◆,它的AI音乐生成功能同样堪称惊艳◆★■★。
很遗憾,国内科技(自)媒体对硅谷公司的科技成果习惯◆★★■◆■“炸裂式◆◆■■★”报道,对国内科技公司的成果却往往视而不见■◆★◆◆,这种“偏见”真得改改了■■◆★。
如果想要风格不一样的动漫图呢?我试着让天工AI智能体下面的二次元漫画给我制图■★◆,主题是乔布斯与iPhone同步出现,结果也同样能直接用。
传统搜索引擎基于PageRank算法对海量内容进行匹配再排序,核心比拼的是“排序”能力。