计算机行业动态研究:GPT-4O、GEMINI新品接连发布 多模态技术奇点加速到来
更新时间:2024-11-23 23:11
zixunge
1
事件: 2024 年5 月14 日,OpenAI 在官网正式发布新旗舰模型GPT-4o 多模态大模型,其中o 代表的是omni,即“全能”,GPT-4o 可以实时对音频、视觉和文本进行推理,相较于GPT-4 Trubo 速度更快、价格更便宜。 2024 年5 月15 日,2024 年谷歌I/O 大会正式召开,会上谷歌将搜索业务做了最彻底的AI 改造, 更新升级了Gemini1.5Pro 版本, 推出Gemini1.5Flash 轻量化小模型、生成视频模型Veo、AI 智能体ProjectAstra,并展示了与GPT-4o 相似的语音视觉交互功能Gemini Live。 投资要点: GPT 持续迭代,GPT-4o 推动人机交互再上新台阶OpenAI 持续升级GPT 版本,2023 年3 月发布GPT-4 在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023 年11 月发布GPT-4Turbo,支持125 万tokens 的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o 带来各种能力升级: ①多模态交互,具有更优质的视频和音频理解以及图像生成能力: GPT-4o 能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。 ②情绪感知:GPT-4o 能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o 能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。 ③毫秒级响应:GPT-4o 对音频输入的响应时间可以快到232 毫秒,平均为320 毫秒,这与人类在对话中的响应时间相近,此前GPT-4 的语音响应约5.4 秒。 ④性能&成本优势:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比GPT-4 Turbo,GPT-4o 推理速度提升2倍的同时,价格降低50%。 打造全新GPT 语音助手且免费开放,合作苹果&微软加速端侧落地OpenAI 通过GPT-4o 打造的语音版ChatGPT 助手,当前已在ChatGPT 中开放使用,同时模型API 同步放出。GPT 语音助手主要功能包括与用户跨音频、视频进行交流,例如,让GPT-4o 进行实时翻译、唱歌、做数学题、讲笑话等。未来,OpenAI 将会在ChatGPT Plus 中推出新版语音模式GPT-4o 的alpha 版。 OpenAI 与苹果合作,加速ChatGPT 在端侧落地。OpenAI 宣布推出一款适用于macOS 的桌面级应用,使用键盘快捷键就可向ChatGPT提问。用户可通过电脑与ChatGPT 语音对话,GPT-4o 的新音频和视频功能后续将推出。据《每日经济新闻》援引彭博社5 月10 日报道,苹果被曝正与OpenAI 敲定一项协议,今年将后者的部分技术引入iPhone。 借此苹果将能提供由ChatGPT 支持的“聊天机器人”,作为iOS 18 中人工智能功能的一部分。 谷歌发布Project Astra、Veo 等,多模态技术奇点加速到来2024 年5 月15 日凌晨,Google I/O 开发者大会上发布了通用AI 智能体Project Astra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型Veo,谷歌声称,Veo 能够根据文本、图像创建超过60 秒的高质量1080P 视频,用户可以对光照、镜头语言、视频颜色风格等进行设定。 我们认为,OpenAI、谷歌等新品的推出,体现出多模态大模型技术的持续升级,GPT-4o 的发布将革新人机交互模式,推动大模型在终端加速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。 行业评级及投资策略:GPT-4o、Gemini 新品陆续发布,多模态大模型技术奇点加速到来,大模型的商业价值、AI 应用的创新突破以及AI 算力需求的持续增长可期,维持对计算机行业“推荐”评级。 相关个股: (1)大模型:科大讯飞、三六零、拓尔思、云从科技;(2)AI 应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科技、彩讯股份、佳发教育、鸥玛软件、拓维信息;(3)AI 终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达; (4)AI 算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。 风险提示:宏观经济影响下游需求、大模型发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期等。 【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
标签:
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
还木有评论哦,快来抢沙发吧~