Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 广告合作
  • 赞助一下
  • 关于我们
资源推荐
阿里云优惠券
卓越的云计算技术和服务提供商
腾讯云优惠券
云服务器,云数据库,CDN,域名注册等多种云计算服务
扣子Coze
创建属于你的 AI 应用,AI Agent智能办公平台
豆包AI
字节跳动旗下 AI 智能助手
即梦AI
一站式智能创作平台,即刻造梦
AiPPT
全智能AI一键生成 PPT
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
蜂小推
不扣量的项目推广平台
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

Droidrun

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

网站地址:https://droidrun.ai/
GitHub:https://github.com/droidrun/droidrun
网站描述:开源AI手机操作工具,支持Agent操作 Android 手机
访问官网
GitHub

Droidrun 是AI手机操作工具,支持 AI Agent像人类一样操作 Android 手机。Droidrun由运行在电脑或云端的 LLM 智能体和安装在手机上的 DroidRun Portal App 组成,结合视觉解析、UI 提取和 LLM 推理,实现复杂任务自动化。Droidrun支持用户基于简单的自然语言命令完成应用启动、UI 操作等任务。Droidrun 支持 OpenAI、Anthropic、Gemini 等多种 LLM 提供商,提供 Python api 用在自定义自动化。Droidrun 为构建强大的 AI 助手和实现复杂任务自动化提供新的可能。


主要功能

  • 视觉 + UI 解析:结合视觉模型(识别屏幕内容)和 UI 结构提取(解析控件树),实现精准交互。
  • 智能自愈机制:智能检测错误(如网络中断、界面变化),自动调整操作路径,确保自动化流程的稳健性。
  • 自然语言控制:用户基于自然语言指令直接控制 Android 设备,例如打开应用、发送消息等。
  • 多 LLM 支持:支持多种大型语言模型(LLM)提供商,如 OpenAI、Anthropic、Gemini 等,用户根据需要选择不同的模型。
  • 极简命令行操作:提供易于使用的命令行界面,方便用户快速部署和执行自动化任务。
  • 丰富的扩展能力:提供可扩展的 Python API,用户能自定义自动化脚本,满足个性化需求。
  • 自动化测试支持:执行固定 UI 流程并验证是否成功,适用于测试工程师的自动化测试场景。


技术原理

  • 自然语言处理(NLP):基于大型语言模型(LLM)解析用户的自然语言指令。模型理解用户的意图,生成相应的操作序列。
  • 视觉解析:基于截图功能获取手机屏幕的图像,用视觉模型(如 OCR 技术)解析屏幕上的文字和控件。让 LLM 能够“看到”手机界面,更准确地理解当前的上下文并生成正确的操作指令。
  • UI 结构提取:基于 Android 的 Accessibility Service API 提取屏幕的 UI 结构信息。分析 AccessibilityNode 信息,DroidRun 能识别屏幕上的按钮、输入框等控件,实现精准的操作。
  • 操作指令生成:LLM 根据解析的自然语言指令和屏幕上下文信息,生成具体的操作指令序列
  • DroidRun Portal App:安装在 Android 手机上的 DroidRun Portal App 负责接收来自电脑或云端的指令,基于 ADB 或 Wi-Fi 将指令转换为实际的手机操作。


应用场景

  • AI手机助手:让AI像人一样操作手机,完成各种操作。
  • 跨应用数据交互:实现不同应用间的数据传递和任务流转。
  • 自动化任务执行:自动完成订车、录视频等复杂任务。
  • 数据提取与录入:高效提取和录入应用中的数据。
  • 多设备协同控制:支持多设备批量操作和任务分配

仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4320

更多»
热门资源
豆包AI
字节跳动旗下 AI 智能助手
官网
扣子Coze
创建属于你的 AI 应用,AI Agent智能办公平台
官网
DeepSeek
幻方量化公司旗下的开源大模型平台
官网
GitHub
即梦AI
一站式智能创作平台,即刻造梦
官网
AiPPT
全智能AI一键生成 PPT
官网
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
官网
LiblibAI
一站式AI内容创作生成平台,原创AI模型分享社区
官网
Trae
字节跳动推出的 AI原生编程工具
官网
美图设计室
AI智能一键生成海报,免费平面设计
官网
AI提示词商城
AI提示词交易与管理平台,提升效率
官网
ChatGPT
OpenAI发布新一代语言模型
官网
Gemini
Google 推出的一款对话式 AI 工具
官网
类似于Droidrun的资源
Wonder Studio
真人一键自动转换为CG
官网
codeAI
一款革命性的VS Code插件
官网
YouChat
AI搜索对话工具
官网
GPT-SoVITS
一个开源的语音合成项目
点击进入
GitHub
Character.AI
是一个神经语言模型的聊天机器人网络应用
官网
BiliNote
开源的AI 视频笔记生成工具
点击进入
GitHub
agenticSeek
一个100%本地运行的 Manus AI 替代品
官网
GitHub
Qwen-Image-Layered
阿里推出的AI图像编辑模型
点击进入
GitHub
目录

手机扫一扫预览

》
分享组件加载中...
首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架 实用工具箱 广告合作 关于我们

Copyright © 2018 Web前端开发网提供免费在线工具、编程学习资源(教程/框架/库),内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。