Holo3 是 H Company 面向 GUI Agent 与 Computer Use 场景推出的新一代视觉语言模型。 开放权重版本 Holo3-35B-A3B 支持 web、desktop、mobile 场景下的界面理解、元素定位、任务导航与动作执行, 适合企业自动化、浏览器操作、表单处理与跨系统工作流。
面向 Holo3-35B-A3B 本地部署、GUI Agent 推理与企业自动化场景的配置建议
适用于本地测试、界面理解验证、元素定位实验与小规模自动化原型
适用于企业级 GUI Agent、网页导航平台、表单与审批自动化
适用于多租户 Computer Use 平台、企业 Agent Fabric 与大规模任务编排
围绕 Holo3 的界面理解、元素定位、导航推理与动作执行能力构建企业应用
在复杂网页中执行搜索、点击、填写表单、跳转页面与多步任务,提升企业流程自动化能力。
对截图、桌面界面、管理后台和业务软件进行视觉理解,精准识别可交互元素和动作目标。
根据 PDF、邮件、截图和业务规则,从文档中提取信息后在多个系统中完成录入与处理。
在多个应用之间切换执行任务,例如读取报价单、校验预算、发送审批邮件和回写记录。
通过 Holo3 构建可观察、可审计、可回放的企业数字员工,提升标准化流程处理效率。
同时理解浏览器页面、桌面程序和移动端界面,支撑更复杂的全流程业务自动化能力。
基于开放权重 Holo3-35B-A3B 构建本地 GUI Agent 推理服务与企业自动化系统
安装 Python、PyTorch、Transformers 和 vLLM,为 Holo3 本地推理与服务化部署准备环境。
# 创建虚拟环境
python -m venv holo3-env
source holo3-env/bin/activate
# 安装依赖
pip install torch torchvision torchaudio
pip install transformers accelerate sentencepiece vllm
# 验证 GPU
python -c "import torch; print(torch.cuda.is_available())"
从 Hugging Face 下载开放权重版本 Holo3-35B-A3B,用于本地视觉导航与 GUI Agent 推理。
from huggingface_hub import snapshot_download
model_dir = snapshot_download(
repo_id="Hcompany/Holo3-35B-A3B",
local_dir="./models/holo3-35b-a3b",
local_dir_use_symlinks=False
)
print("Model downloaded to:", model_dir)
基于 Transformers 加载模型,输入截图或界面图像,让 Holo3 输出元素理解、动作决策或导航说明。
import torch
from transformers import AutoProcessor, AutoModelForImageTextToText
processor = AutoProcessor.from_pretrained("./models/holo3-35b-a3b")
model = AutoModelForImageTextToText.from_pretrained(
"./models/holo3-35b-a3b",
torch_dtype=torch.bfloat16,
device_map="auto"
)
通过 vLLM 或自定义 FastAPI 服务,统一向浏览器代理、RPA 系统和工作流平台输出推理接口。
from vllm import LLM
llm = LLM(
model="./models/holo3-35b-a3b"
)
# 可继续接入 FastAPI / OpenAI-compatible API
将 Holo3 服务接入浏览器控制、桌面自动化执行器和任务调度平台,并记录日志、截图和回放信息。
import requests
payload = {
"messages": [{"role": "user", "content": "请识别这个页面上的登录按钮位置"}]
}
resp = requests.post("http://localhost:8000/v1/chat/completions", json=payload)
print(resp.json())
我们提供从模型选型、截图推理、导航服务到浏览器 Agent 接入的完整落地方案
资讯问答
相关资讯
更多资讯
常见问题
获取定制化部署方案、GUI Agent 设计与企业自动化落地支持