它提供三种尺寸以满足不同的需求,最大的版本使用十亿个参数分析图像。谷歌在博客文章中写道,PaliGemma 可以为图像生成详细的、与上下文相关的说明文字,超越简单的对象识别来描述动作、情感和场景的整体叙述。该系统在专门任务中也显示出前景。它可以解读医学 X 射线并识别复杂的化学公式。谷歌已通过流行的人工智能平台 Hugging Face 和 Kaggle 向开发人员提供 PaliGemma。与此同时,亚马逊推出了一套名为 Nova 的新人工智能模型,标志着其在人工智能市场的扩张。
周二(12 月) AWS 会 墨西哥电报数据 议上宣布,该平台包括用于六秒视频生成的 Nova Reel 和用于创建文本到图像的 Nova Canvas。该公司表示,新型号提供了更高的速度、更低的成本和微调功能。 Nova Reel 很快将支持两分钟的视频,而 Canvas 则包含水印功能以防止误用。亚马逊通用人工智能高级副总裁罗希特·普拉萨德 (Rohit Prasad) 在一份新闻稿中表示,在亚马逊内部,我们拥有正在运行的 GenAI 应用程序,并且我们对应用程序构建者仍在努力解决的问题有一个鸟瞰图。
Prasad 补充道,我们新的 Amazon Nova 模型旨在帮助内部和外部构建者应对这些挑战,提供引人注目的情报和内容生成,同时在延迟、成本效益、定制、信息基础和代理功能方面取得有意义的进展。推荐元发布更小的人工智能模型,节省大量成本 FSOC 机构需要权力来监督第三方服务提供商 每天发送 Swift 百万条 ISO 格式的消息 人工智能对 BB 支付工作流程的最大影响 查看更多人工智能、人工智能模型、人工智能技术、亚马逊、人工智能智能、计算、数字化转型、GenAI、生成式 AI、谷歌、大语言模型、LLAMA、Llama、LLM、Meta、新闻、Nova、PYMNTS 新闻、技术FSOC 机构需要权力来监督第三方服务提供商十二月,|金融稳定监督委员会(FSOC)周五(12 月 12 日)表示