文章归档

第 2 页。归档页按时间倒序展示,每页只加载一组文章封面,减少首屏压力。

Ollama 上的 Gemma 4 12B 能直接听语音吗?
原创 人工智能 · 阅读

Ollama 上的 Gemma 4 12B 能直接听语音吗?

一次在测试机上对 gemma4:12b 音频输入能力的实测记录:模型元数据声明支持 audio,但 Ollama 原生 /api/chat 不能可靠接收音频;真正可用的是 OpenAI 兼容接口里的 input_audio。

程序员量化交易实战:专栏路线图
原创 量化交易 · 阅读

程序员量化交易实战:专栏路线图

这是一套围绕真实 GitHub 项目推进的量化交易工程实战路线图:从 Python 项目骨架、A 股规则、数据层、因子、回测、模拟盘到提醒、每日运行和运维闭环,每篇文章都要求代码可运行。

Ollama 上的 Gemma 4 12B 能直接读视频吗?
原创 人工智能 · 阅读

Ollama 上的 Gemma 4 12B 能直接读视频吗?

一次从官方资料到本地实测的记录:Gemma 4 12B 具备帧序列视频理解能力,但 Ollama 当前不能直接接收 MP4,稳定做法是先抽帧再多图输入。

接口服务里的 A/B Test:从灰度开关到可信实验
原创 工程实践 · 阅读

接口服务里的 A/B Test:从灰度开关到可信实验

A/B test 不只是前端页面实验。接口服务里的策略、排序、限流、供应商选择和成本控制同样需要实验纪律:稳定分桶、真实曝光、跨请求归因、护栏指标和实验收尾。

浏览器 Agent 能做事以后,第一件事不是放权
原创 人工智能 · 阅读

浏览器 Agent 能做事以后,第一件事不是放权

浏览器 Agent 从能看网页走到能点按钮、填表单、提交操作,产品价值变大了,误操作和越权风险也同步变大。守护栏要比自动化能力先成熟。

Codex App Server:把编码 Agent 接进自己的工作台
原创 人工智能 · 阅读

Codex App Server:把编码 Agent 接进自己的工作台

从 Codex app-server 的协议边界讲起,分析它适合嵌入哪些产品与工程场景,也比较 Claude Code、Cursor 在脚本化、云端 Agent 和自定义集成上的相近能力。