Web前端开发网

fly63.com

首页资源工具文章教程 栏目
  • 关于我们
  • 网站投稿
  • 赞助一下

关闭

搜索

在线工具_工作生活好帮手

打造各种简单、易用、便捷的在线工具,网友无需注册和下载安装即可使用

点击查看

资源分类

AI智能酷站推荐招聘/兼职框架/库模块/管理移动端UI框架Web-UI框架Js插件Jquery插件CSS相关IDE环境在线工具图形动效游戏框架node相关调试/测试在线学习社区/论坛博客/团队前端素材图标/图库建站资源设计/灵感IT资讯
提交资源 / 链接反馈

Llamafile
分享
复制链接
新浪微博
QQ 好友

扫一扫分享

网站地址:https://llamafile.ai
GitHub:https://github.com/Mozilla-Ocho/llamafile
网站描述:单个文件分发和运行LLM
访问官网GitHub

llamafile项目的目标是让开发人员和终端用户更容易访问开源大型语言模型。为此,llamafile项目将llama.cpp与Cosmopolitan Libc结合到一个框架中,将 LLM 的所有复杂性压缩为一个可在大多数计算机上(同时支持 macOS, Windows, Linux, FreeBSD, OpenBSD, NetBSD系统)本地运行的可执行文件(称为“llamafile”),无需安装。


llama.cpp由Georgi Gerganov开发,用于以量化格式运行大型语言模型,因此它们可以在CPU上运行。llama.cpp 是一个 C 库,它允许我们在消费类硬件上运行量化的 LLM。另一方面,cosmopolitan libc 是另一个 C 库,它构建了一个可以在任何操作系统(Windows、Mac、Ubuntu)上运行的二进制文件,而无需解释器。因此,Llamafile 建立在这些库之上,这使得它可以创建单文件可执行的 LLM


可用模型采用 GGUF 量化格式。GGUF是由llama.cpp的创建者Georgi Gerganov开发的大型语言模型文件格式。GGUF 是一种用于在 CPU 和 GPU 上有效且高效地存储、共享和加载大型语言模型的格式。GGUF 使用量化技术将模型从原始的 16 位浮点压缩为 4 位或 8 位整数格式。此量化模型的权重可以以这种 GGUF 格式存储


这使得 70 亿参数模型在具有 16GB VRAM 的计算机上运行变得更加简单。我们可以在不需要 GPU 的情况下运行大型语言模型(尽管 Llamafile 甚至允许我们在 GPU 上运行 LLM)。现在,流行的开源大型语言模型(如 LlaVa、Mistral 和 WizardCoder)的 llamafile 随时可供下载和运行


下载

示例模型:Qwen-7B-Chat/Qwen-7B-Chat-q4_0.llamafile,这个模型是 70 亿参数的 int4 量化版本,4.23GB。

使用modelscope的lib下载单个文件:

from modelscope.hub.file_download import model_file_download

model_dir = model_file_download(model_id='bingal/llamafile-models',file_path='Qwen-7B-Chat/Qwen-7B-Chat-q4_0.llamafile',revision='master')


仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4173

more>>
相关栏目
扣子Coze
创建属于你的 AI 应用
官网
DeepSeek
幻方量化公司旗下的开源大模型平台
官网GitHub
ChatGPT
OpenAI发布新一代语言模型
官网
Gemini
Google 推出的一款对话式 AI 工具
官网
即梦AI
一站式智能创作平台,即刻造梦
官网
Kimi
是一个有着超大“内存”的智能助手
官网
Trae
字节跳动推出的 AI原生编程工具
官网
通义千问
阿里推出的一个不断进化AI大模型
官网
文心一言
百度研发的知识增强大语言模型
官网
Luma AI
一个专注于视频生成技术的平台
官网
腾讯元宝
基于腾讯混元大模型的AI应用
官网
百川智能
汇聚世界知识,创作妙笔生花
官网
Ollama
本地便捷部署和运行大型语言模型LLM框架
官网GitHub
纳米AI
360集团旗下的智能体系统
官网
Claude AI
由Anthropic公司打造一个 AI 驱动的智能交互平台
官网
Grok
马斯克的xAI开发的Grok模型的中文优化版本
官网

手机预览