2026-01-28
长篇小说写作系统的数据底座从JSON文件起步,经历SQLite单库KV存储,最终演进为关系表结构。这一过程将世界设定从文本堆转化为实体关系系统,解决了查询困难、一致性差和跨设备维护崩溃三大问题。通过唯一ID、关系表和SQL查询,AI写作搭档实现了可查、可改、可回溯的记忆能力。
2026-01-25
本文介绍 FantasyNovelAgent 项目,一个会“记忆”的AI写作搭档,通过多Agent架构解决长篇小说创作中遗忘设定的痛点。它提供灵感推演、沉浸式写作、动态记忆和逻辑守卫等核心功能,并采用“各司其职”的大模型策略。文章复盘了项目从文件存储到SQLite数据库的演进,并展望了前后端分离和云原生架构,旨在为读者提供一个高效、智能且能保持上下文一致性的写作辅助工具。
2026-01-24
Kubernetes 并非解决所有部署问题的银弹,其本质是复杂度的交换而非消除。当服务数量少、团队缺乏运维专长或仅需发布容器时,引入K8s会徒增运维负担。只有当规模化治理、弹性调度、多租户隔离成为刚需,且组织愿意投入平台工程时,K8s才能成为效率杠杆。
2026-01-23
利用 Cloudflare Workers、Vectorize、D1 与 Google Gemini 构建零成本、全自动的 AI 语义搜索系统。通过 GitHub Actions 实现写作即部署,自动同步向量。引入动态阈值判定过滤无效匹配,并利用 D1 记录搜索日志,生成 Content Gap 洞察,引导作者填补内容空白,形成内容生产闭环。
2026-01-23
OWASP LLM Top 10 v2.0 框架揭示了大型语言模型应用的核心安全威胁,包括提示注入、敏感信息泄露、供应链漏洞等十大风险。针对每项威胁,提供了基于 Kubernetes 环境的 Python 概念验证攻击代码与防御脚本,涵盖语义过滤、签名验证、最小权限控制等实战方案,帮助平台工程师构建安全的 AI 系统。
2026-01-22
Helm 4 作为 Kubernetes 包管理的重大升级,默认启用 Server-Side Apply 以解决配置漂移和冲突检测,引入 Wasm 插件系统提升安全性与跨平台能力,OCI 成为推荐的 Chart 分发方式,CLI 参数如 --atomic 更改为 --rollback-on-failure。它偿还了历史技术债务,无需数据迁移,但需验证 GitOps 行为与 CLI 脚本兼容性,为生产环境带来更稳定的原生体验。
2026-01-21
Kubernetes 1.35 引入原生 Gang Scheduling 与 Workload API,将调度视角从单 Pod 提升至作业组,彻底解决 AI 训练资源死锁问题。它取代了 Coscheduling 插件,推动架构向“Kueue 决策+原生调度器执行”的简洁分层演进,大幅降低运维成本,为云原生 AI 基础设施提供内核级保障。
2026-01-20
MCP协议让AI获得操作数据库、文件系统等权限,但协议本身不强制认证,导致Prompt注入攻击可劫持这些权限。CVE-2025-49596漏洞(CVSS 9.4)暴露了本地主机劫持风险,供应链攻击和网络暴露同样威胁安全。防御需遵循网络隔离、强认证、最小权限和人工确认四层体系,核心原则是永远不给AI超出黑客能利用的权限。
2026-01-19
2026年企业级LLM可观察性体系从基础设施监控转向业务语义洞察,需构建三层防御:云平台原生监控(如Azure Content Safety)提供基础安全护栏,AI网关(如Kong/APISIX)实现统一鉴权、流控与模型路由,专用可观测工具(如Langfuse/LangSmith)通过链路追踪和自动化评估量化模型质量。三者组合确保成本、安全与效果可控。
2026-01-15
Dragonfly是基于P2P技术的云原生镜像与模型分发基础设施,解决大规模集群并发拉取时的带宽瓶颈与成本。通过分片传输和智能调度将分发压力分散到节点,显著降低回源流量。配合Nydus按需加载,有效缩短AI模型和容器启动时间,已成为CNCF毕业项目并被多家企业采用。