Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 广告合作
  • 赞助一下
  • 关于我们
资源推荐
阿里云优惠券
卓越的云计算技术和服务提供商
腾讯云优惠券
云服务器,云数据库,CDN,域名注册等多种云计算服务
扣子Coze
职场AI,就用扣子
豆包AI
字节跳动旗下 AI 智能助手
即梦AI
一站式智能创作平台,即刻造梦
AiPPT
全智能AI一键生成 PPT
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
蜂小推
不扣量的项目推广平台
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

Llamafile

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

网站地址:https://llamafile.ai
GitHub:https://github.com/Mozilla-Ocho/llamafile
网站描述:单个文件分发和运行LLM
访问官网
GitHub

llamafile项目的目标是让开发人员和终端用户更容易访问开源大型语言模型。为此,llamafile项目将llama.cpp与Cosmopolitan Libc结合到一个框架中,将 LLM 的所有复杂性压缩为一个可在大多数计算机上(同时支持 macOS, Windows, Linux, FreeBSD, OpenBSD, NetBSD系统)本地运行的可执行文件(称为“llamafile”),无需安装。


llama.cpp由Georgi Gerganov开发,用于以量化格式运行大型语言模型,因此它们可以在CPU上运行。llama.cpp 是一个 C 库,它允许我们在消费类硬件上运行量化的 LLM。另一方面,cosmopolitan libc 是另一个 C 库,它构建了一个可以在任何操作系统(Windows、Mac、Ubuntu)上运行的二进制文件,而无需解释器。因此,Llamafile 建立在这些库之上,这使得它可以创建单文件可执行的 LLM


可用模型采用 GGUF 量化格式。GGUF是由llama.cpp的创建者Georgi Gerganov开发的大型语言模型文件格式。GGUF 是一种用于在 CPU 和 GPU 上有效且高效地存储、共享和加载大型语言模型的格式。GGUF 使用量化技术将模型从原始的 16 位浮点压缩为 4 位或 8 位整数格式。此量化模型的权重可以以这种 GGUF 格式存储


这使得 70 亿参数模型在具有 16GB VRAM 的计算机上运行变得更加简单。我们可以在不需要 GPU 的情况下运行大型语言模型(尽管 Llamafile 甚至允许我们在 GPU 上运行 LLM)。现在,流行的开源大型语言模型(如 LlaVa、Mistral 和 WizardCoder)的 llamafile 随时可供下载和运行


下载

示例模型:Qwen-7B-Chat/Qwen-7B-Chat-q4_0.llamafile,这个模型是 70 亿参数的 int4 量化版本,4.23GB。

使用modelscope的lib下载单个文件:

from modelscope.hub.file_download import model_file_download

model_dir = model_file_download(model_id='bingal/llamafile-models',file_path='Qwen-7B-Chat/Qwen-7B-Chat-q4_0.llamafile',revision='master')


仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4173

更多»
热门资源
豆包AI
字节跳动旗下 AI 智能助手
官网
扣子Coze
职场AI,就用扣子
官网
DeepSeek
幻方量化公司旗下的开源大模型平台
官网
GitHub
即梦AI
一站式智能创作平台,即刻造梦
官网
AiPPT
全智能AI一键生成 PPT
官网
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
官网
LiblibAI
一站式AI内容创作生成平台,原创AI模型分享社区
官网
Trae
字节跳动推出的 AI原生编程工具
官网
美图设计室
AI智能一键生成海报,免费平面设计
官网
AI提示词商城
AI提示词交易与管理平台,提升效率
官网
ChatGPT
OpenAI发布新一代语言模型
官网
Gemini
Google 推出的一款对话式 AI 工具
官网
类似于Llamafile的资源
AI小聚
一个综合性的AI助手,集成了AI绘画、音乐、视频和聊天
官网
Fliki.ai
用AI语音将文字变成视频
官网
Isgen AI
最准确的中文AI检测器
官网
MiniMax-ABAB
新一代通用大模型
官网
Suno AI
一个 AI 音乐创作平台
官网
polyAI
语音助手,企业智能客服语音服务
官网
Mureka
昆仑万维公司旗下AI音乐商用创作平台
官网
stockimg AI
可帮助用户在几分钟内生成徽标、书籍封面、横幅等
官网
目录

手机扫一扫预览

》
分享组件加载中...
首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架 实用工具箱 广告合作 关于我们

Copyright © 2018 Web前端开发网提供免费在线工具、编程学习资源(教程/框架/库),内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。