typecho 发布的文章 - XiaoPao Blog

登录

标签搜索

Xiaopao

累计撰写 388 篇文章
累计收到 1 条评论

搜索到 388 篇与的结果

2026-04-20
把 OpenClaw 装进 Hostinger VPS：从零配置到日常使用的全攻略最近在各种社群里看到大家都在聊 OpenClaw，从程序员的「24 小时代码小秘」到普通上班族的「全天候助理」，热度简直跟夏天的空调一样飙升。于是我把自己在 Hostinger VPS 上玩弄 OpenClaw 的全过程，整理成一篇像聊家常一样的长文，帮你把技术壁垒拆得七零八落。🤔 为什么要在 VPS 上跑 OpenClaw？最直白的答案就是：不想让 AI 只活在浏览器标签页。如果你把 OpenClaw 当成普通聊天机器人，它只能在你打开网页、登录账号的那一刻才有反应。把它装在 VPS 上，就像把「小秘书」搬进了自己的办公室——不管你是睡觉、开会还是在咖啡店晃悠，它都在后台默默工作。而 Hostinger 之所以成为我首选，主要有三点：价钱亲民：2 核 8 GB RAM、100 GB NVMe 的套餐每月只要 65.99 元，和普通云服务器的起步价差不多，却自带 hPanel，让新手也能点点鼠标完成部署。一键 Docker 模板：官方已经把 OpenClaw 打包成 Docker 镜像，只要在 hPanel 的 Docker Manager 里点一次「Deploy」，系统会自动把容器拉下来、写好环境变量，几秒钟就能跑起来。一键直达预装 AI 积分：不需要自己去 OpenAI、Anthropic 那套繁琐的 API 申请，直接在 hPanel 里买积分，钱包里的钱会自动喂给 OpenClaw 用。 🛠️ 把 VPS 变成 AI 小工厂的六个步骤下面我把每一步拆得像做家常菜的配方，照着做基本不会出错。买 VPS——打开 Hostinger 一键直达，选「OpenClaw VPS」套餐，建议直接选 KVM 2（2 vCPU、8 GB RAM），因为 OpenClaw 加上 AI 模型跑起来会吃点内存。连上服务器——在 hPanel 找到 IP，打开终端（或 Windows PowerShell）执行 ssh root@your-ip，记得先改个强密码。装 Docker（如果面板没有自动装）： apt update && apt install -y docker.io docker-compose systemctl enable --now docker 如果已经在 Docker Manager 里看到 OpenClaw，可以直接跳过。部署 OpenClaw：在 Docker Manager 搜「OpenClaw」镜像，点「Deploy」，弹窗里填好环境变量OPENCLAW_GATEWAY_TOKEN（系统会自动生成，务必保存），以及你的 AI 积分或 API Key。点击「Deploy」后，容器会在 1‑2 分钟内启动。打开管理界面：容器默认映射 18789 端口。用浏览器访问 http://your-ip:18789/?token=你的TOKEN，进去后会看到类似微信聊天框的 UI。绑定聊天渠道：点左侧「Channels」>「Add」，选择 Telegram、WhatsApp、Slack 任意一个，系统会弹出二维码或 Bot Token，让你在对应的 APP 里完成配对。配对成功后，AI 就可以在这些渠道收到你的指令了。到这里，你已经拥有了一个「随叫随到」的数字小助理，基本流程和在本地电脑装软件差不多，只是把硬件搬到了云端。💡 实际使用场景：从「省时间」到「变现」下面列几个我在实际工作和生活中看到的常见玩法，帮助你快速找到适合自己的使用方式。1. 个人效率助理把日历、邮件、RSS 订阅全都塞进 OpenClaw，设定每天早上 8 点自动发送「今日要事」报告。只要在 Telegram 里发一句「给我今天的晨报」，它立刻把日程、未读重要邮件、行业热点整理成 Markdown 发给你，省下的时间足够喝两杯咖啡。2. 销售线索筛选器把 Telegram 里收到的陌生消息交给 OpenClaw，让它先进行关键词匹配、评分，只有高分的才转给真人销售。实际案例中，团队把线索过滤率从 70% 降到 20%，大幅提升了转化率。3. 代码审查机器人在 GitHub Action 中调用 OpenClaw 的 shell 技能，让它在 PR 合并前跑一次「代码风格」检查、自动生成评审评论。对于小团队来说，等于是把 1 个全职审查员的工作压缩到了几秒钟。4. 内容创作流水线内容创作者可以把「采集热点 → 写提纲 → 生成稿件」全流程交给 OpenClaw。只需在 Discord 里发「帮我写一篇关于 2026 年 AI 趋势的文章」，它会先抓取热点、写提纲、润色后给你草稿，你只需要稍作修改就能直接发布。5. 学生学习伙伴把课堂 PDF、截图丢进聊天框，OpenClaw 自动提炼要点、生成「一页速记」；再让它每天推送 3 道练习题。有人用这个方法把期末 GPA 从 3.2 提升到 4.0，简直是“开挂”。⚠️ 常见坑 & 小技巧端口安全：默认 18789 是公开端口，建议在防火墙里只放通自己 IP，或者使用 ssh -L 做本地隧道访问。内存不够：如果在使用本地模型（比如 Ollama）时出现 OOM，立刻升级到 8 GB 以上的套餐，或者把模型换成云端 API。 AI 积分用完：hPanel 里可以随时追加购买，记得打开「自动提醒」功能，余额低时会收到邮件。多 Agent 管理：如果你想跑多个 AI 小助理，别把它们都塞进同一个容器。直接复制一份 Docker Compose 配置，改端口和 token，互不干扰。 🔮 小结：把 AI 从「玩具」升级为「队友」从最初的「我想要一个能聊天的机器人」到现在的「它能帮我写代码、写报告、跑广告、甚至帮我预约健身」，OpenClaw 的进化速度让人惊讶。最关键的不是技术本身，而是「把它装进 VPS，让它随时在线」这一步。只要有了这块「全天候的电脑」，你再也不需要担心「今天的任务卡住」或「凌晨的灵感跑不出来」。如果你还在犹豫是否要花钱租一台 VPS，想想每天省下的 1‑2 小时，那相当于每月 50 元的成本已经被时间的价值回本了。赶紧去 Hostinger 选个套餐，点一下「Deploy」，让你的 AI 小助理今天就上线吧！🚀
- 2026年04月20日
- 71 阅读
- 0 评论
- 0 点赞
2026-04-19
把所有大模型装进一个窗口——Cherry Studio 使用全攻略与实战感受最近看到大家在 Reddit 上刷到一个「Prove your humanity」的弹窗，里面让你点一下验证码才能继续。其实这只是 Reddit 为了防止机器人刷帖的一个小把戏，跟我们日常使用 AI 应用时遇到的「验证人类」差不多。这里顺着这个话题，我想聊聊最近火热的桌面 AI 客户端——Cherry Studio，顺便把它和这类安全验证的关系、使用体验、以及到底适不适合我们这些普通用户说清楚。🔍 什么是 Cherry Studio？简单来说，它就是一个把「ChatGPT、Claude、Gemini、DeepSeek」等上百种大模型装进一个窗口的万能工具。想象一下，你平时打开浏览器需要开好几个标签页去分别使用不同的 AI，复制粘贴提示词、切换账号，真是麻烦。Cherry Studio 把这些碎片整合在一起，左侧选模型，右侧直接对话，甚至还能一键打开「知识库」让 AI 读取你的文档。它是跨平台的，Windows、Mac、Linux 都能跑，一键安装，几乎不需要额外配置。🚀 为什么它能帮我们省事？ **模型一键切换**：一次点击就能从 GPT‑4 切到 Claude 3.5，甚至本地 Ollama 模型，省去去官网申请 API 的麻烦。 **300+ 预置助手**：写代码、写文案、做翻译、画图都有现成的模板，你只要点开就能直接使用，根本不需要自己调 Prompt。 **本地隐私**：所有聊天记录、知识库文件都保存在本机，数据不会跑到第三方服务器，跟你在手机上使用本地记事本的安全感一样。 **多格式文档**：PDF、Word、PPT 统统能拖进去，让 AI 帮你抽取要点、生成摘要，省得手动翻一页页看。 🛠️ 用起来到底顺不顺手？我第一次打开 Cherry Studio，界面还有点像「酷炫的插件市场」——左侧是模型列表，右侧是聊天框。点击「新建助手」，会弹出一个可编辑的 Prompt，直接填入需求就行。最让我惊喜的是「旁边对话窗口」能同时显示两个模型的回复，我把同一个问题分别丢给 GPT‑4 和 Claude，立刻看到两种思路的对比，这种「模型辩论」在普通网页里根本做不到。不过，真正让它像「聊天小伙伴」的，是它的「知识库」功能。把公司内部的技术文档拖进去，AI 能在问答时直接引用文档内容。想象你在写技术报告时，突然想查某个接口的细节，只要在聊天框里问：「请告诉我 X 接口的返回字段」，AI 立马给出答案，速度堪比把文件翻找完直接给你答复。⚡️ 与「人机验证」的关联说到 Reddit 的验证码，我想到了两件事： **安全感**：验证码本质是让我们确认自己是人，防止机器人滥用资源。Cherry Studio 同样把「数据安全」当成第一要务，所有本地存储让我们免除「数据被盗」的担心。 **使用门槛**：验证码本身会让人觉得有点繁琐，但它比起在不同网站上反复登录要简单得多。Cherry Studio 通过“一次登录、全模型可用”，把繁琐的 API Key 配置压缩成几步，降低了技术门槛。所以，从「防机器人」到「防数据泄露」，这两者的出发点其实是一致的——让人类更安心地使用 AI。💡 实际案例分享下面给大家举几个我自己使用的场景，帮助你更直观感受：写邮件：我把老板的需求文档扔进知识库，然后让 AI 生成一封正式邮件，直接复制粘贴，省了 15 分钟。代码调试：遇到 Python 报错，我选了「代码助理」模型，让它帮我定位错误原因并提供修复建议，省得在网上搜索堆栈溢出。多语言翻译：在准备对外宣传材料时，我让 AI 同时给出中、英、日三语版本，对比后挑选最自然的表达。 📈 资源占用与容量规划如果你像我一样会同时打开多个模型，硬件配置还是要稍微关注下。根据官方的容量规划指南：使用场景推荐内存CPU 核心数是否需要 GPU 基础使用（聊天、翻译）8 GB4 核可选中等负载（文档解析+并发模型）16 GB8 核建议专业使用（大模型本地推理+知识库）32 GB 以上12 核 以上必需如果你只是日常聊天，用普通的笔记本就足够；但如果想本地跑 70 B 大模型，那就真的需要高配机器了。🔧 小技巧，让 Cherry 更好用 **按需加载模型**：在设置里把不常用的模型关闭，能省掉约 30% 的内存占用。 **定期清理缓存**：软件自带「清除缓存」按钮，建议每两周点一次，防止缓存无限增长。 **使用 WebDAV 备份**：如果你在多台设备上使用，打开 WebDAV 同步，保持知识库文件一致。 **自定义快捷键**：在设置 → 快捷键里把常用功能绑定到键位，操作更顺手。 💭 结语总的来看，Cherry Studio 把「多模型 AI」的复杂度压缩到了「打开一个软件」的程度，像是把桌面上的「AI 超市」搬进了你的电脑。它既解决了「验证码」那种需要确认身份的繁琐，又提供了本地化的安全感，让我们可以放心地把重要文档交给 AI 来帮忙。如果你已经在为切换模型、复制提示词而头疼，或者想把 AI 融入到日常工作流，强烈建议下载试用一下。没有什么比亲自感受更可靠——打开软件，挑个模型，跟它聊上一会儿，你会发现，原来 AI 离我们并不遥远。好啦，今天的分享就到这里。希望这篇长文能帮你在选择 AI 桌面客户端时少走弯路。如果你已经在使用 Cherry，欢迎在评论里聊聊你的使用体验，咱们一起玩转 AI！😊
- 2026年04月19日
- 82 阅读
- 0 评论
- 0 点赞
2026-04-19
Pixel 系列使用感悟：从硬件争议到 AI 价值的全方位聊聊嗨，朋友们，今天想跟你们唠一唠我这些年和 Google Pixel 系列的酸甜苦辣。别担心，我不会把一大堆专业术语往你们脸上扔，像在咖啡馆里跟老友聊天那样，轻松聊聊这几个值得关注的点。一、外观设计：辨识度 vs. 细节粗糙先说外观。Pixel 6 那套横跨机身的相机模组，真的像穿着宽大外套的潮流达人，一眼就能认出来。看到它，路人会问“这是不是刚发布的 Google 手机？”这点我挺喜欢，因为它给人一种独特的身份感。但细节上，它的摄像头模块凸起太高，导致大多数官方壳子都要“妥协”。相机玻璃用了三片式而不是一体式，长时间使用后缝隙里会积灰，手感也不如圆滑。就像你买了个外形酷炫的外套，却发现里面的拉链卡住了。二、硬件配置：自研芯片的两极化体验Pixel 6 开始用了 Google 自研的 Tensor 芯片，听起来很高大上。实际上，它主要是把 AI 加速器和图像处理单元整进了 SoC。拍照方面，它把很多计算摄影的魔法搬到了本地，离线也能用夜视模式。然而，这种自研芯片的性能在同年代的高通旗舰上只能算中等。跑分上比不上 Snapdragon 8 Gen 1，感觉像是跑得稍慢但跑得更省电的那种车。对日常刷微博、看视频基本够用，但想玩大型游戏就会有点吃力。三、系统体验：原生 Android 的温柔与局限Pixel 系列是 Google 官方的原生 Android 体验代表。Android 12 在 Pixel 6 上的 Material You 主题让 UI 看起来更有个性，颜色会跟壁纸自动匹配，像是手机会跟你的心情换装。不过在中国使用时，Google 服务被墙，很多关键功能（如 Gmail、地图）只能靠 VPN。没有了这些便利，日常使用体验会大打折扣。就像你买了个高配的咖啡机，却没有水和电，冲不出咖啡来。四、拍照功能：算法算得好，硬件只能跟随Pixel 系列的相机一直是它的卖点。Night Sight、天文模式、动作摇摄、长时间曝光……这些看似高大上的功能，其实都是靠强大的算法把普通的硬件“捏”出来的。举个例子，Pixel 3 当年配的是 1200 万像素的传感器，但通过像素合并技术，拍出来的照片细节丰富，甚至能和后来的 5000 万像素机型媲美。就好比一位厨师，用普通的配料做出顶级的料理。但如果你追求光学变焦和更大的光圈，Pixel 6 系列的单摄（Pro 除外）还是会让人失望。算法只能补强，不能完全取代光学硬件。五、续航与充电：意外的“短板”Pixel 4 系列的电池容量直接降到 2800 mAh，导致续航成为口碑炸雷。Pixel 5 把电池提升到 4080 mAh，续航才稍稍好转。对我来说，手机一天两充已经算正常，尤其是跑 AI 功能时更耗电。充电速率一般在 18W 左右，算不上快充明星，但日常使用够用。只要你不急着在咖啡店里边充电边等朋友聊，没太大问题。六、AI 与服务：Pixel 的独特价值点如果你是 AI 爱好者，Pixel 真的是个好玩具。Google AI Pro、Gemini、Notebook LM 这些服务都和手机深度绑定，付费试用期会赠送大量云存储和 AI 功能。比如用 Gemini 直接在手机上生成图片、写文案、甚至编辑视频，省去在电脑上切来切去的麻烦。不过，这些高级功能往往需要在国外账号或付费才能完整体验。国内用户想要完整使用，得先搞定 VPN，或者在购买时多留意是否附带试用权益。七、入手建议：怎么挑适合自己的 Pixel1️⃣ 预算有限且想尝鲜：Pixel 3/3 a 系列二手价格在 400‑600 元左右，拍照能力仍然不俗，适合想玩算摄影的朋友。2️⃣ 追求最新 AI 功能：Pixel 9/10 系列配合 Gemini AI Pro，能体验最新的 Google AI 生态，但要做好fq准备。3️⃣ 注重续航与性价比：Pixel 5 是折中之选，电池大、系统更新到 2024 年，适合日常使用。4️⃣ 想要大屏折叠体验：Pixel 9 Pro Fold 虽然价格高，但给你一台可以当小平板的手机，适合重度媒体用户。八、我的小结总的来说，Pixel 系列像是一位“理想主义者”，它把软件体验做到极致，却在硬件细节和本地化适配上略显“理想化”。如果你愿意花时间去学习、去解决网络限制，Pixel 能带来不少惊喜：原生的 Android、强大的拍照算法、以及不断升级的 AI 服务。而如果你只想要开箱即用、无脑好用的手机，或许国内品牌更适合。就像买衣服一样，Pixel 更像是定制的艺术服装，你得先量体裁衣。希望这篇聊聊能帮你在选购和使用 Pixel 时少走弯路。如果还有啥想了解的，留言聊聊，我们一起玩转这些“谷歌的娃娃”。😊
- 2026年04月19日
- 83 阅读
- 0 评论
- 0 点赞
2026-04-19
Mac Mini 16GB和32GB跑OpenClaw到底有何区别？一篇聊聊我的实战体会嗨，朋友们！今天想跟你们聊聊一个很多人都在问的现实问题：Mac Mini 16 GB和32 GB在部署 OpenClaw 时真的一样吗？我自己折腾了好几个月，踩了不少坑，收获了一堆血泪经验。下面用轻松的口吻把过程拆开来，帮助你们省点时间、少点焦虑。先说结论：不一样，差距大到可以用“质变”来形容如果你只想让 OpenClaw 当个轻量的消息转发机器人，16 GB 还能跑得动；但一旦想让它本地跑大模型（比如 7 B、14 B），或者兼顾多任务、多渠道，32 GB 就是最低安全线，16 GB 很可能直接卡死。为什么内存这么重要？Mac Mini 用的是 Apple Silicon 的统一内存（UMA），CPU、GPU、神经网络引擎共用同一块 RAM。想象成一条唯一的高速公路，车流（算力）和行李（模型权重）都得一起装进同一车厢。内存不够，车子根本装不下，跑起来只能“哐哐”卡住。OpenClaw 本体占用网关守护进程：≈300‑500 MB 每个消息渠道（飞书、Telegram 等）：≈100 MB 沙箱容器（执行工具调用）：≈1 GB 合计：在 1‑2 GB 左右就能稳定跑一个基本机器人。这部分对 16 GB 和 32 GB 都绰绰有余。本地大模型的“体积”下面是一张常见模型对应的内存需求表（按量化后估算），只要把它们的需求和统一内存对比，就能直观看到差距：模型参数量量化后需要的 RAM在 16 GB 能否跑在 32 GB 能否跑 Qwen 2.5‑7B7 B8‑10 GB✅ 边缘可用✅ 轻松 Qwen 2.5‑14B14 B14‑16 GB⚠️ 极限，容易 OOM✅ 稳定 Qwen 3‑32B32 B24‑32 GB❌ 直接爆内存✅ 入门门槛 70 B+ 超大模型70 B+48 GB +❌ 完全不行❌ 仍不足两大使用场景的对比场景一：只用云端 API（Claude、GPT、Gemini）这时候 OpenClaw 只负责把指令转发给云端大模型，自己本身不需要额外的显存。实际测评： 16 GB：基本够用，跑 1‑2 个并发任务时会看到偶尔的内存警告，长时间多会出现卡顿。 32 GB：内存余量充足，打开多个渠道、运行工具调用（比如自动化浏览、文件检索）毫无压力。如果你预算紧、只想把机器人当成“聊天转发器”，16 GB 完全可以接受，只是未来想扩展功能时会受限。场景二：本地跑 LLM（Ollama + Qwen / Llama 等）这才是大家最期待的“零成本、零延迟”。但本地模型是占内存的大块砖头： 16 GB只能跑 7 B 左右的模型，而且只能在极低并发下运行，工具调用经常因 KV‑Cache 超限报 OOM，甚至直接把网关挂掉。 32 GB能稳定跑 7‑14 B 模型，支持多渠道和工具调用，响应时间在秒级，体验跟云端差不多。换句话说，从“能跑”到“跑得舒适”，一次升级从 16 GB 跳到 32 GB 完全值得。实战案例：我的 16 GB 与 32 GB 机器的对比案例一：单聊机器人（只用 Claude）两台机器都装了 OpenClaw + 飞书插件，指令只走云端。16 GB 机器在高峰期（10 条并发消息）日志里出现了 memory pressure 警报，偶尔会卡住 5‑10 秒。32 GB 机器则始终保持流畅，即使同时跑 3 项自动化任务也没有抖动。案例二：本地跑 Qwen‑7B + 飞书我先在 16 GB 机器上下了 ollama run qwen2.5:7b，启动后马上看到系统内存占到 9 GB，OpenClaw 只剩下 6‑7 GB 可用。一次连续对话（约 50 条）后，模型的 KV‑Cache 爆满，系统直接 OOM，网关崩溃，需要手动重启。换到 32 GB 机器后，同样的对话过程里内存最高只到 15 GB，余量足够，让 KV‑Cache 能继续增长，机器人可以无间断工作 2‑3 小时甚至更久。升级建议 & 小技巧如果你只能买到 16 GB，强烈建议先走云端 API，等有需求再换 32 GB。Apple Silicon 的内存是焊死的，升级成本很高。在本地跑模型时，务必开启 tools.profile=minimal，可以略微降低工具调用的内存占用。使用量化模型（如 Q4_K_M）可以把占用降到 60% 左右，仍然需要足够的余量。定期查看系统日志（Activity Monitor）和 OpenClaw 日志，留意 memory pressure 警告。总结：你到底该选哪款？如果你的需求是：只想让机器人帮你收发消息、调取 API、做点小自动化 → 16 GB 足够，但建议预留一点升级空间。想本地跑任何有意义的模型（7 B 以上）或同时开启多个渠道 → 32 GB 是安全线，没有它基本会卡死。说到底，Mac Mini 就像一辆小轿车：16 GB 版是城市代步，够用但略显紧凑；32 GB 版是长途旅行的 SUV，装得下更多行李，路上也更稳。根据自己的使用场景和预算，挑一款最合适的配置吧！祝你玩得开心，AI 机器人跑得顺畅 🚀
- 2026年04月19日
- 92 阅读
- 0 评论
- 0 点赞
2026-04-18
Google 的 Windows 桌面 AI 搜索，真的像朋友聊天一样好用吗？前言：聊聊这款“新玩具”最近，Google 在 Windows 上推出了自己的桌面搜索小助手，叫做 Google app for desktop。听起来像是要把我们平时在浏览器里打字搜索的方式，直接搬到了桌面上。核心功能盘点这款应用的卖点可以归结为三大块：跨平台搜索——不仅能搜本地文件，还能顺手翻翻 Google Drive。 AI Mode——基于 Gemini 3 的大模型，直接给你 AI 风格的答案，甚至能继续追问。 Google Lens + 屏幕共享——看到画面上的文字、图片，直接让 AI 解释。配合 Alt+Space，几乎不需要任何鼠标敲击，整个过程像是和朋友聊天时顺手敲出的那句“帮我搜一下”。我的真实使用场景第一次用它的时候，我在写一篇文章，手头正好有一个 PDF 需要快速找关键句子。打开 PDF，按 Alt+Space，输入“关于气候变化的段落”，AI 直接把段落摘要出来，还标记出处。真的是“一键搞定”。还有个小例子：我在厨房做菜，想找一款素食的酱料配方。敲了一声“附近有什么素食推荐”，它不仅列出附近的店，还给出价格、评分，甚至菜品照片。真的像是有个贴心的小帮助。亮点与不足亮点很明显——快、准、还能直接看图说话。但也有一点需要提醒：目前只有英文版，中文用户可能会遇到部分功能不完美的情况。另外，AI 的答案并非 100% 绝对准确，遇到专业或敏感内容时，可能需要自行再核实。小结：它到底像不像朋友聊天？总的来说，Google 的这款 Windows 桌面搜索工具，真的把搜索变成了一种“轻松聊天”的体验。只要你愿意按一下快捷键，它就会在你身旁出现，像朋友一样给你答案。 irregardless，它让我感受到科技可以更温暖，而不是冰冷的机器。如果你和我一样，平时经常在电脑前来回切换文档、网页、云端文件，这款工具绝对值得一试。它或许不是完美无缺，但已经让日常工作更加顺手，且充满了“小确幸”。
- 2026年04月18日
- 98 阅读
- 0 评论
- 0 点赞
2026-04-17
一杯咖啡的时间，玩转 AIClient-2-API：让免费大模型随手可得你有没有碰到过这样的场景：手里有个创意想实现，却被高昂的 AI 调用费用拦住了路？我也是，尤其是想写点代码自动化、或者让聊天机器人更懂我，结果每次调用 OpenAI、Claude 之类的接口，都得盯着钱包哭泣。后来我偶然在 GitHub 上刷到一个叫 AIClient-2-API 的项目，感觉像在咖啡店里意外发现了免费咖啡券，忍不住立刻试了一下。到底是什么鬼？简而言之，它是一个小巧的本地代理服务器。它把只能在官方客户端里用的模型（比如 Google Gemini、Kiro 的 Claude、阿里 Qwen Code）“搬”出来，包装成和 OpenAI 完全一样的接口。于是，原本只能在 Chrome 里玩 Gemini 的你，直接在 VS Code 插件、Postman，甚至自己写的脚本里调用，和调 OpenAI 没有任何区别。为什么值得一玩免费+无限：通过 OAuth 授权，你可以使用 Google 账号的 Gemini 免费额度，甚至还能免费玩 Kiro 上的 Claude Sonnet 4.5。省的每个月都要算模型费用。一键切换：只要改改 config.json 里的 "MODEL_PROVIDER"，或者在 URL 里加上路径前缀，就能在 Gemini、Claude、OpenAI、Qwen 之间切换，根本不需要改代码。可视化管理：自带的 Web 控制台像个小仪表盘，点几下就能上传 OAuth 凭据、查看健康状态、实时日志，完全不需要手敲命令。多模态&流式输出：支持图片、文档等输入，还能像打字机一样实时流式返回结果，体验超级丝滑。动手打开它下面用最懒的方式给你画个流程图，保证你在喝完咖啡前就能跑通：准备环境：装好 Node.js >=20，如果你用 Docker 更省事，直接把镜像拉下来。启动容器（推荐）docker run -d -p 3000:3000 -p 8085-8086:8085-8086 -p 1455:1455 -p 19876-19880:19876-19880 \ -v "$(pwd)/aiclient-config:/app/configs" \ --name aiclient2api justlikemaki/aiclient-2-api 这一步把本地的配置目录挂进去，后面所有的凭据、账号池文件都会保存在这里。打开 Web UI：浏览器访问 http://localhost:3000，默认密码是 admin123，进去后立马能看到仪表盘。生成授权：在「提供商池」里点 "Generate Auth"，比如选 Gemini，就会弹出 Google 登录窗口，授权后系统自动把 ~/.gemini/oauth_creds.json 复制进挂载目录。Claude、Kiro、Qwen 也类似。切换模型：点「配置管理」→「默认模型」，选你想要的模型（比如 gemini-3-pro、claude-sonnet-4-5、qwen3-coder-plus），保存即可。只要以上步骤都走通了，你的本地地址 http://localhost:3000/v1/chat/completions 就能直接被任何 OpenAI 客户端使用。实际案例：把它接进 LobeChatLobeChat 是个开源的聊天 UI，默认只能连 OpenAI。把它指向本地代理后，你可以立马把 Gemini 的 3.0 Pro 当成 gpt-4 用，费用降到零。配置方法也很简单： API Base URL: http://localhost:3000 API Key: 任意字符串（比如 123456） Model: gemini-3-pro 保存后，打开对话框，输入「解释一下相对论」——几秒钟后，Gemini 把答案返回，整个过程和使用官方 API 没有区别。账号池与降级策略：玩转配额免费额度往往会被单个账号吃光，AIClient-2-API 提供了「账号池」功能。你可以把多个 Google 账号、多个 Kiro 账号、甚至不同地区的代理都放进 provider_pools.json，系统会智能轮询、自动切换。比如： { "gemini-cli-oauth": [ {"uuid": "acc1", "priority": 1}, {"uuid": "acc2", "priority": 2} ], "claude-kiro-oauth": [ {"uuid": "kiro1", "priority": 1} ] } 当第一个账号的配额耗尽，系统自动切到第二个，几乎不出现 429 错误。再配合跨类型 fallback（比如 Gemini 失效后自动切到 Claude），就像给你的请求装了一个备胎，稳得一批。常见坑 & 小技巧端口冲突：如果本机已经在 3000 端口跑了别的服务，记得改 config.json 里的 SERVER_PORT，或者在 Docker 启动时映射不同端口。 403 被拦住：尤其是 Grok、某些地区的 Gemini，需要开启 TLS Sidecar（在配置里把 TLS_SIDECAR_ENABLED 打开），它会伪装成浏览器的 TLS 指纹，突破 Cloudflare 的封锁。日志太多：如果不想把每一次 Prompt 都打印到控制台，改成 "PROMPT_LOG_MODE": "file"，日志会落到 prompt_log-YYYY-MM-DD.log，以后可以用 grep 搜索关键词。模型名称大小写：别忘了在请求里写对模型名字，例如 gemini-1.5-flash 而不是 Gemini-1.5-Flash，不然会返回 "model not available"。打开新可能：多模态和 Claude 思考AIClient-2-API 还能把图片、文档塞进去。比如想让模型分析一张设计稿，只要把图片转成 base64，放进 image_url 字段，Gemini 会返回图层信息。Claude 还有「thinking」模式（额外的推理预算），只要在请求里加： "extra_body": { "anthropic": { "thinking": {"type": "enabled", "budget_tokens": 8000} } } 这对于需要深度代码审查、或是让模型先做思考再输出的场景非常有帮助。总结：给自己的 AI 旅程装上免费加速器把 AIClient-2-API 当成一把钥匙，打开了多个模型的大门。它把繁琐的 OAuth、配额管理、协议转换都藏在后台，让你只专注于业务本身。最重要的是，它真的能把「免费」变成「可用」——不再因为高额费用而止步不前。如果你现在还在为每次调用付费而犹豫，不妨先把它跑起来，感受一下免费模型的力量。相信我，等你把它写进自己的工具链后，那种掌控感会让每一次敲代码都像喝到一口浓郁的咖啡，回味无穷。声明：AIClient-2-API 为Github开源项目，请严格遵守项目作者的相关要求，自行承担后果。
- 2026年04月17日
- 103 阅读
- 0 评论
- 0 点赞
2026-04-16
XChat来了，它真的能撼动微信和LINE吗？大家好，今天我们坐在咖啡店的角落，聊聊最近热闹的一个话题——马斯克的新聊天应用 XChat。它被包装成“西方版微信”，到底是闹剧还是下一代社交的先驱？我会把技术细节拆成生活里的小故事，让你听得明白，也能想象自己在使用时的感受。一、XChat到底是啥？想象一下，你在iPhone上打开一个全新的聊天软件，它不需要你绑定手机号，只要一个 X 账号就能登录。和你平时刷的微博一样，所有联系人都在同一个账号里，你可以直接发消息、打视频电话，甚至还能把 AI 小助手直接塞进聊天框里帮你翻译、安排行程。它的核心卖点是“无广告、强隐私”。这点跟我们平时用的微信、LINE不一样，它们常常会在聊天窗口旁边推送广告或是把聊天数据用于推送内容。二、功能对比：XChat VS 微信 VS LINE下面用一张简易表格把三大软件的核心功能对比一下，帮助你快速抓住重点：功能XChat微信LINE 是否需要手机号注册不需要，只要 X 账号必须绑定手机可选绑定广告无广告、无追踪有广告+推广有广告端到端加密宣称全面加密部分加密端到端加密（仅限特定聊天）消息撤回/编辑都有都有都有截图防护检测并提醒无无文件大小上限目前未公布，预计大文件传输200MB1GB 支付功能尚未上线完整的微信支付生态LINE Pay 小程序/生态待开发成熟的“小程序”生态贴纸、服务三、为什么会有人对它抱有期待？1️⃣ 隐私焦虑的释放：现在大家对个人信息泄露越来越敏感，尤其是广告追踪和手机号绑定。XChat 把这些“门槛”直接拆掉，像是给你一个不被监视的私人空间。2️⃣ 广告噪声的消失：想象一下，你正在和朋友聊八卦，突然弹出一条商业广告，真是糟心。XChat 承诺全程无广告，让聊天回归本质。3️⃣ AI 加持的未来感：XChat 把「Grok」AI 嵌进聊天，能在对话里直接帮你翻译、查天气、做计划。就像在跟朋友聊天时，身边有个随叫随到的助理。四、挑战到底有多大？不过，光有这些亮点并不等于一定能取代微信和 LINE。下面列出三个主要阻力：用户黏性——大多数人习惯了朋友们都在同一个平台，换一个平台意味着要重新建立社交网络，成本不小。生态体系——微信的“拼多多”式小程序、付款、公交卡、医院挂号，已经深深嵌入日常生活。XChat 目前没有支付、没有小程序，短期内难以替代。监管与合规——在中国，社交软件需要通过严格的内容审查和数据本地化。XChat 若想进军中国市场，还得面对一堆政策红线。五、可能的落地场景虽然全盘取代的可能性不大，但 XChat 仍然可以在细分场景生根：跨境工作者：不想把个人手机号暴露给公司，直接用 X 账号登录即可。创作者社区：对隐私要求高、需要大文件传输的设计师、摄影师们可以先在 XChat 里交流作品。企业内部沟通：企业可以把 XChat 当作内部安全通讯工具，不用担心广告或数据被第三方收集。六、我的小结：是风口还是泡沫？如果把社交软件比作一座城池，微信是已经建好的“故宫”，LINE 是东京的“秋叶原”，而 XChat 则是刚刚起土的“新社区”。它的优势在于“干净、私密”，这对我们这些讨厌广告、怕被监控的人是福音。但要想让这座新社区变成“繁华都市”，还需要更多配套设施——支付、生活服务、内容生态。所以，我个人倾向于把 XChat 看作一种“新玩法”，适合有特定需求的用户；而对大多数普通用户来说，短期内仍会继续使用微信或 LINE。当然，随着时间推移，如果 XChat 能快速推出支付和小程序功能，它的竞争力会大幅提升。不管最后结果如何，这场“西方版微信”的挑战让我们看到了社交软件的多元化趋势。也许未来的社交不再是“一家独大”，而是像咖啡店一样，随时可以切换不同的座位，选自己喜欢的氛围。你觉得呢？如果有一天你真的开始用 XChat，你最期待的功能是什么？欢迎在评论区聊聊你的想法！😊
- 2026年04月16日
- 113 阅读
- 0 评论
- 0 点赞
2026-04-15
甲骨文免费VPS到底值不值得玩？一步步带你弄清楚嘿，朋友们，今天我们来聊聊最近在技术圈被反复提起的甲骨文 Oracle Cloud 免费VPS。如果你像我一样，偶尔会想摆脱高额云费用，试着把小项目、个人网站甚至是玩玩玩（比如小爬虫、VPN）托管在所谓的‘白嫖’服务器上，那这篇文章一定会让你在咖啡店的悠闲时光里搞定整个流程。先说结论——它到底好不？简而言之，甲骨文的免费层可以提供 2 台 x86（AMD）+ 1~4 台 ARM 实例，每台都配有 1 核 CPU、1 GB 内存、50 GB 磁盘，以及每月 10 TB 的出站流量。再加上 300 美元的 30 天试用额度，这在不想花钱的情况下已经足够跑个人博客、轻量 API、甚至是小型数据库。但它也有几个“坑”。第一，注册过程对信用卡和 IP 环境非常挑剔；第二，免费实例会在资源不足的热门地区被秒抢；第三，如果不定期登录账号，资源会被回收。所以，想要长期保持它的可用性，需要一点耐心和技巧。为什么会有这么多教程？从我看到的八几篇教程（像是 GWVPS、RedMan、NodeSeek、Jiemahao、XiaoGe、挖主机）里，几乎每篇都在强调三件事：准备一张双币（VISA/MasterCard）信用卡，最好不是虚拟卡；使用干净的 IP（直接用手机 5G 或者家里宽带，别开 VPN 代理）；地址、手机号、卡片账单地址要保持一致。这说明，Oracle 并不是想让大家轻松白嫖，而是希望真正需要云资源的用户能承担一点“安全阈值”。注册全过程——像玩拼图一样下面我把一遍遍试错的经验浓缩成四步，让你一次就能顺利过关。1️⃣ 打开官方免费页面，填基本信息访问 Oracle Cloud 免费试用，点“立即免费试用”。国家/地区一定要选与你信用卡发行国相同，比如中国卡就选中国。名字、姓氏全用拼音（这一步很多人会直接写中文，导致后面地址匹配出错）。填写邮箱后点“验证我的电子邮件”，记得用常用邮箱（Gmail、QQ、163 都行），邮件里点链接继续。 2️⃣ 设置密码、地址、主区域密码最好用大小写+数字+符号组合，避免后面登录受阻。地址栏一定要用英文，和信用卡账单地址保持 100% 一致。街道、城市、邮编都别漏。主区域（Home Region）选一个非热门但有配额的地区。我个人最稳的选择是美国西部的 Phoenix（凤凰城）或者日本东京。如果你想要低延迟可以选东京/首尔，但这些地方经常被抢光。 3️⃣ 信用卡验证在“添加付款方式”页面填入卡号、有效期、CVV。系统会预扣约 1.38 新元（约 6 元人民币），随后会自动冲回。只要扣款成功，后面就算不升级也不会产生费用。如果提示失败，先检查：卡片是否支持境外在线支付（有的银联卡会被拒）；是否开启了 3D 验证或手机短信验证（一些银行需要提前开通）；是否使用了代理或 VPN（IP 与真实地点不匹配会直接炸掉）。 4️⃣ 完成注册，登录控制台成功后你会收到一封标题为 “Get Started Now with Oracle Cloud” 的邮件，里面有登录链接。点进去在浏览器里打开控制台，别忘了在右上角切换语言为中文，操作更顺手。创建免费实例——一步不漏这一步在所有教程里基本相同：左侧菜单 → 计算 → 实例 → 创建实例。名字随意，可不改。位置必须和注册时选的主区域保持一致，不能改。操作系统建议选 Ubuntu 22.04 LTS，兼容性最好。在实例配置里，务必勾选“始终免费（Always Free）”的实例类型，否则会进入付费计费。 SSH 密钥是关键，Oracle 不允许密码直连。可以在本地用 ssh-keygen 生成一对密钥，或在控制台勾选“为我生成”。记得把私钥下载下来保存好。磁盘默认 46.6 GB，足够日常使用；如想要大点空间可以自行调到 50 GB（AMD）或 100 GB（ARM），但别超过免费配额。点创建后几分钟内实例就会显示 “运行中”。如果出现错误，一般是因为选错了付费机器或配额已满，重新挑一个免费标签的配置即可。打开防火墙，让它真正“活”起来默认情况下，Oracle 会关闭 ICMP（Ping）和大部分端口。要让外部能访问你的服务，需要在子网 → 安全列表里添加入站规则：源类型：CIDR，源 0.0.0.0/0（所有 IP）协议：TCP，端口范围填 22（SSH）或你自己的服务端口（80、443 等）再加一条 ICMP 规则，开启 Ping，调试时非常便利。保存后，你的服务器就能被外网访问了。连上服务器——从钥匙到密码的转换在本地打开终端（Mac/Linux）或 Putty（Windows），执行：ssh -i /path/to/your_private_key.pem opc@YOUR_VPS_IP默认用户名是 opc（Oracle Cloud 的特殊叫法），登录后可以用 sudo -i 提升到 root。如果你想改成密码登录，执行下面两行：passwd # 为 root 设置密码 sed -i "s/#PermitRootLogin.*/PermitRootLogin yes/" /etc/ssh/sshd_config sed -i "s/PasswordAuthentication no/PasswordAuthentication yes/" /etc/ssh/sshd_config systemctl restart sshd以后直接用用户名 root + 你设置的密码登录就可以了。常见坑与避坑指南 IP 被封：如果你频繁进行大流量下载或违规行为，Oracle 会直接禁用账号。记得遵守使用条款。账号被回收：超过 60 天未登录，免费资源会被回收。设置个闹钟，隔几天登录一次检查。配额用光：每个账户在每个区域只能有固定数量的免费实例。想多开可以在不同区域分别注册两个账号（但要确保 IP、信用卡的信息不冲突，否则会被风控）。超过配额导致付费：一不小心选了付费实例或调高了磁盘容量，系统会提示预估费用。务必在“始终免费”标签上打勾。信用卡二次验证：30 天后系统可能再次扣小额费用验证卡片。保持卡内有足够余额，否则账号会被锁。到底该不该用？我的小结如果你是学生或刚入行的开发者，想用低成本跑实验；爱好者想搭建个人博客、GitLab、VPN 或小型监控系统；预算紧张，又不想被花里胡哨的付费套餐绑住。那它绝对值得一试。只要你能接受偶尔的注册波折、稍微花点时间做防火墙配置，它的免费算力、流量、存储在同类云服务里算是“相当慷慨”。但如果你准备把业务直接搬到这里做生产级服务，还是建议使用正式付费套餐，毕竟免费层的资源和 SLA 都没法保证长久。小贴士——让你的免费 VPS 更好玩利用 300 美元试用额度，在免费层之外跑一次高配实验，比如大模型推理或 GPU 可视化；把实例的根磁盘快照做成备份，防止误删后可以快速恢复；通过 Cloud Shell（浏览器终端）直接在控制台里跑脚本，省去本地配置；如果需要 IPv6，参考官方文档一步步打开 IPv6 CIDR，很多国内项目都可以直接使用。总的来说，甲骨文的免费 VPS 就像是咖啡店里那杯免费试喝的咖啡：味道不错，足够提神，但喝多了还是要买正品。希望这篇摆脱术式的“保姆级”指南，让你在不花一分钱的前提下，轻松玩转 Oracle Cloud，享受真正的技术自由。
- 2026年04月15日
- 88 阅读
- 0 评论
- 0 点赞
2026-04-15
从 Gemma 4 到 Hermes Agent：本地 AI 大模型的实战思考与生活化指南最近在咖啡馆里，偶然听到旁边的朋友在聊「Gemma 4」和「Hermes Agent」——听起来像科幻小说里的神器，但其实离我们每个人的日常已经不那么遥远了。今天我想把这些技术拆成可操作的碎片，像给你递上一杯温热的咖啡，慢慢品味它们在本地电脑上跑起来的可能性。👀 为什么要关注本地大模型？想象一下，你在写代码、整理文档、甚至聊天时，总是要把请求丢到外部云平台——每一次都要等网络来回，费用也像咖啡豆一样不断累积。如果把模型直接装在自己的机器里，就像把咖啡机搬到家里，想喝时随时按按钮，零等待、零流量、零隐私泄露。⚙️ Gemma 4：Google 的新一代本地友好模型Gemma 4 有四个规格，最常被提到的是 2 B、4 B、26 B（Mixture‑of‑Experts）以及 31 B（Dense）。它们的共同点是：采用宽松的 Apache 2.0 许可证，商用、闭源都不怕踩雷。专为本地运行调优，参数效率高，显存占用比同等 dense 模型低很多。原生支持高级推理、函数调用、结构化 JSON、system 指令和多模态（文字、图片、音频）输入。最有意思的是 26 B 的 MoE（Mixture‑of‑Experts）结构——总参数看起来有 26 B，但每次推理只会 Activate 大约 3.8 B，等于是只打开一扇门，让模型在显存压力和算力需求之间找到了黄金平衡。对一块 24 GB 显卡来说，跑 26 B 的 MoE 已经可以和跑 4 B dense 的体验差不多，却拥有更强的推理能力。🚀 本地跑通的三条路径从源码到部署，我总结了三条最常见的道路，供你挑选： Ollama + 本地 Gemma 4：最省事的方式，只需要一行 curl 安装 Ollama，随后 ollama pull gemma4:26b 就能把模型拉到本地。显卡 < 16 GB 用 2 B/4 B，显卡 ~24 GB 用 26 B，显存更高的可以直接玩 31 B。 Ollama + Open‑Chat（或 Hermes Agent）：在 Ollama 基础上接入一个本地助手框架，提供工具调用、浏览器自动化等能力。关键是要使用 Ollama 原生的 http://127.0.0.1:11434 接口，别走 /v1 的 OpenAI 兼容层，否则工具调用会失效。云端 OpenAI 兼容 API（比如薛定猫）：如果手头没有合适的 GPU，先在云端走一遍验证。因为大多数本地框架都实现了 OpenAI 兼容的 REST 接口，代码可以保持不变，后面再切回本地模型。这三条路最大的好处是「代码不变，换模型」。写好一次调用代码，换成本地 Ollama 或者云端服务，只需要改一下 URL 和模型名。🛠️ Hermes Agent：会记忆、会成长的个人 AI 小伙伴说到本地智能体，我必须把目光投向 Hermes Agent。它不像传统的「一次性」Agent，更多像是你的私人助理，甚至可以把自己的经验写进自己的简历：持久化记忆：所有对话会被存入本地向量数据库，系统会把历史记忆做一次摘要，帮助后续对话快速回溯。 Skill 自动生成：完成一次任务后，框架会把任务拆解过程抽象成结构化的 Skill，下次遇到类似需求直接调用，省掉重复思考的时间。闭环训练雏形：在执行工具调用时产生的轨迹可以导出，用来微调底层模型，真正做到“用模型帮助自己改模型”。这些功能听起来有点像科幻电影，但在实际使用中已经可以感受到：比如让 Agent 写一段爬虫代码，它会先生成代码、执行、捕捉报错、再自动改进，直到成功为止。整个过程不需要你一次次手动调试，Agent 能自己把“错误”当作学习材料。🧩 把两者拼起来：本地多模态 AI 工作流实战下面给出一个我自己玩过的例子，帮助你把 Gemma 4（E2B）和 Hermes Agent 组合成一个完整的本地 AI 栈：在本地装好 Ollama，拉取 gemma4:e2b（约 2 B 参数，几乎可以在 8 GB 显存的笔记本上跑）使用 vLLM 将模型包装成 OpenAI 兼容的 HTTP 服务，端口 8000。运行 Hermes Agent 的安装脚本，让它在「Custom Endpoint」里填入 http://localhost:8000/v1，模型选 google/gemma-4-e2b-it。给 Hermes Agent 加入「图片识别」Skill：在聊天里发送一张商品照片，Agent 会把图片喂给 Gemma 4（多模态输入），返回产品描述并自动生成一个 Markdown 报告。后续每次再问相似商品时，记忆库已经把之前的描述向量化，能够快速检索并给出一致的答案。整个闭环只需要几分钟的配置，却让本来需要云端调用的功能，全部跑在自己的电脑里。更重要的是，所有交互都是本地完成的，隐私不再是担心的点。💡 实际选型小贴士显存不够？先尝试 2 B/4 B 版的 Gemma 4，或者把模型量化成 Q4_K_M 格式，显存需求能降低 30% 以上。想要长上下文？选择 Edge 版（E2B/E4B），它们默认支持 128K token，足够一次性给模型阅读一本短小说。工具调用不稳定？务必使用 Ollama 原生 API（不要走 /v1），因为原生层保留了完整的 function calling 协议。企业级需求（比如合规、审计）可以先在云端用薛定猫这样聚合平台做 PoC，确定业务流程后再迁移到本地。 📚 小结：从“技术干货”到“日常助理”把大模型装进自己的电脑，听起来像是把巨兽搬进小屋。Gemma 4 用轻量化、MoE 和 Apache 2.0 授权，让这件事在硬件可及范围内变得现实。Hermes Agent 则把“会说话的模型”升级为“会记住、会学习、会复用经验”的数字助理。两者结合后，你可以在本地搭建一个完整的 AI 工作流：从多模态感知、长上下文推理，到工具调用、记忆沉淀，全部闭环在自己的掌控之中。如果你和我一样，对技术有一点小狂热，又怕被 SaaS 限制住手脚，那么现在正是把这套本地 AI 栈搬回家的好时机。把 Ollama 当作厨房的燃气灶，把 Gemma 4 当作主食原料，把 Hermes Agent 当作会帮你切菜、调味的智能厨师，你的创意料理就可以随时上桌。🌟祝你玩得开心，记得把成功的经验写进自己的 Skill 库，下一次再让 Agent 自动复用！
- 2026年04月15日
- 111 阅读
- 0 评论
- 0 点赞
2026-04-14
把 OpenClaw 换成免费模型：省钱又不失智能的实战指南最近刷到一个视频，讲的是有人一晚上把 OpenClaw 开着，第二天醒来发现 API 账单直接冲上几百美元。听起来像是科幻片里的情节，却是真的在我们身边发生的事。想象一下，你的电脑像个不睡觉的咖啡店服务员，源源不断地帮你点单、写代码、跑任务，结果账单像雨后春笋一样冒出来——这就是 OpenClaw 带来的便利与风险。OpenClaw 是什么？为什么会贵？OpenClaw 本质上是一个让普通 PC 变成「全自动 AI 代理」的工具。它可以自己写代码、调工具、完成工作流，听起来像是给电脑装上了大脑。于是我们只需要装个应用，授权它访问我们的工具，它就能自己跑起来。问题是，这些「跑起来」的动作背后，都要通过 OpenAI、Anthropic 之类的 API 消耗 token。每一次对话、每一次代码生成，都要付费。只要模型跑得久，费用就会像水龙头一样不停流。尤其是配置不当、出现死循环时，费用会在几分钟内飙到几百美元。省钱的思路：免费模型到底能不能用？别急，视频里给出了几条实在的省钱办法。核心思路就是把收费的大模型换成免费的大模型，或者利用已有的订阅免除额外收费。利用 NVIDIA 提供的 Kimi‑K 2.5 免费模型。只要去 build.nvidia.com/moonshati/Kimi-K-2.5，生成 API Key，复制下来。在 OpenClaw 的配置页面（Config → raw mode）手动添加 Kimi 的模型块，把它设为主模型，把原来的 GPT 放到 fallback 里。还有 OpenRouter，里面有一些标记为 $0 的模型，例如 DeepSeq R1‑0528。先在 openrouter.ai 创建 API Key，再在 OpenClaw 里选 OpenRouter 并填入模型名。如果你已经是 ChatGPT Plus、Gemini Pro 之类的订阅用户，也可以用 OAuth 登录，让 OpenClaw 直接走你的订阅渠道，不再额外计费。这些办法的共通点是：先把「付费入口」换成「免费入口」，然后让 OpenClaw 用新模型跑。步骤虽然有点技术味，但只要跟着视频的代码复制粘贴，基本不需要自己写太多代码。实战案例：我把 OpenClaw 从 GPT 换到 Kimi我自己也试过，把原本天天跑在 GPT‑4 上的 OpenClaw 换成了 Kimi。整个过程大概用了 15 分钟：打开浏览器，进到 NVIDIA 的模型页面，点「Generate API Key」，复制那串以 nvapi- 开头的钥匙。回到 OpenClaw 的网页控制台，左侧点 Config，打开 raw mode，粘贴官方提供的 Kimi 配置块。在 agents 部分加一个 fallback，把原来的 GPT 放进去。点 Save，等状态从红转绿。去聊天页面发「Hi」，再问「你是哪款模型？」得到「Kimi」的回答，说明切换成功。切换后，我的日常任务（自动生成日报、抓取网页信息）仍然顺畅，唯一的差别是 OpenClaw 再也没有偷偷吃掉我的钱包。为什么免费模型还能满足日常需求？很多人担心免费模型性能不够。其实日常的「写点代码、抓取数据、写邮件」这类任务，对模型的要求并不像高级创意写作那样苛刻。Kimi、DeepSeq 这些模型在语言理解和基本推理上已经相当稳健，完全可以应付日常自动化需求。如果真的需要更高质量的输出，可以把免费模型设为 primary，收费模型设为 fallback。这样大多数情况下用免费模型，只有在免费模型卡壳时才会调用付费模型，费用自然被控制在低水平。防止「不小心烧钱」的几个小技巧给 OpenClaw 加上超时限制。比如在配置里设置每次调用最多 30 秒，超过就直接停止。使用监控脚本，定时读取 API 使用量，一旦突破阈值就自动暂停服务。尽量在本地跑模型，或者使用上面提到的免费模型，减少对外部 API 的依赖。在配置文件里把高消耗的插件或技能先关掉，只保留必要的功能。这些方法像是给你的电脑装上了「安全阀」，即使你忘记关机，也不会让账单爆炸。展望：AI 自动化的未来会是怎样？OpenClaw 这类工具让 AI 真正走进了普通人的工作流。它的潜力不只在于省时，更在于把重复、机械的任务交给机器，让我们有更多时间做创意、社交、休息。不过，随着模型越来越强大、使用场景越来越广，费用管理也会成为每个人必须掌握的基本技能。像我们今天讨论的「免费模型、OAuth、超时」这些技巧，都像是给新手的防身术，帮助大家在享受 AI 红利的同时，不被高额账单绊倒。如果你也在尝试 OpenClaw，或者已经被它的「自动化」吸引，不妨先把模型切到免费选项，先感受一下自动化的快感，再慢慢探索更高级的功能。记得随时检查费用，设好上限，别让「智能」把你的钱包搞得像黑洞一样。最后，祝大家玩得开心，钱包安全！🚀
- 2026年04月14日
- 87 阅读
- 0 评论
- 0 点赞