Ai


  • 简介
  • 目录大纲
  • 最新文档

    多模态

    /root/llama.cpp/llama-server \ --model /model/Qwen3.6-27B-GGUF/Qwen3.6-27B-UD-Q4_K_XL.gguf \ --mmproj /model/Qwen3.6-27B-GGUF/mmproj-F16.gguf \ --host 0.0.0.0 --port 8000 \ --temp 0.6 \ ……

    admin - 2026年4月30日 16:59


    backup2

    ``` vllm serve /model/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled \ --served-model-name qwen27b \ --host 0.0.0.0 \ --port 8000 \ --max-model-len 2048 \ --gpu-memory-utilization 0.9 \ -……

    admin - 2026年4月14日 16:23


    OpenClaw

    安装后必备命令(建议立刻保存) openclaw doctor # 健康检查 + 安全提醒(必跑!) openclaw status # 查看运行状态 openclaw gateway status # 查看网关状态 openclaw dashboard # 浏览器控制面板(最快上手测试) 理解核心文件 OpenClaw在~/.openclaw/w……

    admin - 2026年4月7日 12:40


    工具

    nvtop #查看显存 llmfit #查看机器适合跑什么模型

    admin - 2026年4月6日 13:02


    环境

    ``` 好的,信息已经很完整了!帮你整理一份从零开始、针对 RTX 4090 + Ubuntu 部署 vLLM + Qwen3.5 的完整指南。 Ubuntu + RTX 4090 搭建 vLLM 跑 Qwen3.5 完整指南 📋 前置了解:4090 能跑哪个 Qwen3.5 模型? Qwen3.5 目前发布的尺寸包括:0.8B、4B、9B、27B、35B-A3B(MoE)、397B-A17B……

    admin - 2026年4月6日 12:59



    admin