fly63前端网

www.fly63.com

首页文章资源工具教程 栏目
  • 关于我们
  • 网站投稿
  • 赞助一下
搜索

在线工具_工作生活好帮手

打造各种简单、易用、便捷的在线工具,网友无需注册和下载安装即可使用

点击查看

关闭

提交网站

Gemini
分享
复制链接
新浪微博
QQ 好友

扫一扫分享

网站地址:https://deepmind.google
网站描述:谷歌发布最新人工智能模型

谷歌公司推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。


Gemini 是包括 Google Research 在内的 Google 各团队间进行广泛合作的成果。它从一开始就被创建为多模态的模型,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。

Gemini 也是我们迄今为止最灵活的模型,从数据中心到移动设备,它能够在所有设备上高效运行。其先进的功能将显著改善开发者和企业客户通过 AI 构建和扩展的方式。

Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra,它们的大小和功能均有所增加。


模型能力

复杂多模态推理能力

该模型具有复杂多模态推理能力,可以同时识别文本、图像、音频、视频和代码五种信息。它能够发现大量数据中难以辨别的知识,因此能够更好地理解微妙的信息,并回答复杂的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

例如,Gemini 能够独立批改物理作业,在正确“读懂”题目、识别凌乱手写笔迹的同时,指出学生在解题过程中的错误,并给出正确答题步骤。通过图像和语音输入,Gemini可以指导做菜,并在不同阶段提出相应的建议。

编码能力

Gemini可以理解、解释和生成世界上最流行的编程语言(如Python、Java、C++和Go)的高质量代码。同时,Gemini还可以用作更高级编码系统的引擎。

识别交互能力

Gemini支持输入文本、图像、音频和视频,输出图像和文字。其多模态为原生多模态(natively multimodal),可以“无缝”理解、操作和组合不同类型的信息,拥有了强大的交互能力。

解决问题的能力

据谷歌介绍,从自然图像、音频、视频理解到数学推理,Gemini Ultra在32个常用的学术基准的30个上领先GPT 4。而在MMLU(大规模多任务语言理解)测试中,Gemini Ultra以90.0%的高分,成为第一个超过人类专家的模型。

MMLU测试包括数学、物理、历史、法律、医学和伦理等57个学科,旨在考察世界知识和解决问题的能力。


链接: https://fly63.com/nav/4029

more>>
相关栏目
文心一言
百度研发的知识增强大语言模型
官网
Bard
Google 推出的一款对话式 AI 工具
官网
讯飞星火
科大讯飞推出的新一代认知智能大模型
官网
盘古大模型
华为盘古大模型,重塑千行百业
官网
豆包AI
字节跳动旗下 AI 智能助手
官网
Anthropic Claude
Anthropic发布的与ChatGPT竞争的聊天机器人
官网
Adobe Firefly
Adobe最新推出的AI图像生成和编辑工具
官网
Midjourney
一款AI绘画工具
官网
LLaMA
Meta(Facebook)推出的AI大语言模型
点击进入GitHub
AI提示语
AI提示指令,让生产力加倍!
官网
百川智能
汇聚世界知识,创作妙笔生花
官网
通义千问
一个不断进化的AI大模型
官网
Ollama
本地便捷部署和运行大型语言模型LLM框架
官网GitHub
DeepSeek
幻方量化公司旗下的开源大模型平台
官网GitHub
火山写作
字节跳动推出的一款AI智能写作服务
官网
Stable Diffusion
最强开源AI绘画工具
官网

手机预览