site stats
Geimini 1.5 原生多模态的音频理解, 强的有点夸张...不仅能识别说话语气, 还能自动识别说话人到人名?我拿了一个最近两天的音频给Geimin 1.5问: "整体概括, 告诉我前两分钟说话的人是谁. 语气如何"不仅几乎完美回答, 同时还把具体说话的美国议员的名字都识别出来了... (这真不是data leak?)
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多