1. 月之暗面科技发布多模态图片理解模型,具备强大的图像识别能力和OCR文字识别功能,支持多轮对话和工具调用,但暂不支持联网搜索。
2. MiniMax开源MiniMax-01系列模型,采用创新线性注意力机制,高效处理长文本,性能与国际顶尖模型相当,提供低价格API服务。
3. 周鸿祎参演AI短剧,利用AI特效和硬件,传递正能量,推动AI技术普及和360纳米AI搜索产品发展。
4. 阿里巴巴达摩院推出电商场景多模态大模型Valley2,结合视觉编码器和创新处理模块,在多个基准测试中表现卓越。
5. ChatGPT上线“Tasks”功能,允许用户安排未来操作和提醒,提升实用性,目前仅限于付费用户。
6. Kokoro-TTS小型文本转语音模型表现卓越,在TTS领域排名领先,训练过程合规高效。
7. Topview AI推出数字人解决方案,可生成手持产品的数字人进行讲解,节省时间和成本,支持多种语言和个性化定制。
8. 英伟达投资MetAI,推动AI数字双胞胎技术发展,将CAD文件快速转换为3D环境,缩短创建时间。
9. 科大讯飞星火4.0Turbo升级,数学和代码能力超越GPT-4o,在复杂数学问题处理上展现更强能力。
10. Google的Gemini AI实现实时视频与静态图像同步处理,打破以往限制,应用潜力广泛。
11. 科大讯飞发布星火同传语音大模型,达到人类专家译员水平,提升翻译流畅性和准确性。
12. OpenBMB发布多模态模型MiniCPM-o2.6,在边缘设备上高效运行,支持视觉、语音和语言处理,适用于多个行业应用。
- 转载请保留原文链接谢谢!
- 本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
- 本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
- 本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
- 联系方式:936787576@qq.com