
Google DeepMind团队于5月27日宣布,它推出了Signgemma,这是最强的手语翻译模型,能够将手语转换为口语文本。开源模型将于今年晚些时候加入Gemma Model家族。 Signgemma支持多语言功能,但目前正在以-Depthly -Depthly -Depthly American For American Mign语言(ASL)和英语进行优化,开发人员可以使用它并改进它。 DeepMind希望使用这项技术帮助语言用户超越沟通障碍,并参与工作,学习和社交。今年,DeepMind还启动了Gemma 3N模型,该模型可以从音频,图像,视频和文本输入中生成智能文本,从而帮助开发人员创建了实时的Interactive Applications(IT IT)。 Google与佐治亚州技术与野生海豚项目合作,基于巴哈马大西洋海豚的长期研究数据,建立了一个海豚模型,以研究和生产海豚在声音中。此外,作为Gemma 3家族的新成员,Medgemma模型侧重于AI医学领域,支持临床推理和医学成像,并促进了医疗和人工智能的整合和变化。