AI 认知基础
提示词工程、模型原理、工具使用与开源精选 -- 共 47 篇
开源精选
Awesome LLM Apps & AI Agents
Deutsch | Español | français | 日本語 | 한국어 | Português | Русский | 中文 🌟 Awesome LLM Apps A curated collection of Awesome LLM apps built with RAG, AI Agents, Multi-agent Teams, MCP, Voice Agents, and...
Large Language Model (LLM) Course Roadmap
𝕏 Follow me on X • 🤗 Hugging Face • 💻 Blog • 📙 LLM Engineer's Handbook The LLM course is divided into three parts: 🧩 LLM Fundamentals is optional and covers fundamental knowledge about...
Prompt Engineering Guide
Prompt Engineering Guide Sponsored by Prompt engineering is a relatively new discipline for developing and optimizing prompts to efficiently use language models (LMs) for a wide variety of...
AI 认知基础
AI图像生成风格提示词矩阵
AI图像生成风格提示词矩阵 引言:从文本到视觉的工程化桥梁 AI图像生成已经从早期的"随机碰运气"进化为一门可系统化的工程实践。无论是产品经理为新功能制作概念图、设计师快速出原型、还是技术负责人为架构文档生成示意图,掌握结构化的风格提示词方法论都是核心竞争力。本文将从工程化视角出发,构建一套覆盖12种主流视觉风格的提示词矩阵,并针对Midjourney、DALL-E、Stable...
Few-Shot学习模式全解
Few-Shot学习模式全解 示例选择策略、动态 Few-Shot 构建与 In-Context Learning 的工程化实践 | 2026-02 一、什么是 Few-Shot Learning Few-Shot Learning(少样本学习)是通过在提示词中提供少量示例来引导 LLM 完成特定任务的技术。不同于传统机器学习的微调,Few-Shot 不修改模型权重,而是利用 LLM...
Meta-Prompting:让AI优化AI的提示词
Meta-Prompting:让AI优化AI的提示词 自动化提示词优化、DSPy 框架与评估驱动的 Prompt 进化 | 2026-02 一、Meta-Prompting 的核心思想 Meta-Prompting 是用 LLM 来优化 LLM 的提示词。这不是一个新概念——它本质上是把"提示词工程"这个人类任务也交给 AI 来完成,形成自我改进的闭环。 Traditional Prompt...
Prompt 自动优化:DSPy 与自动提示词工程(2026 年版)
Prompt 自动优化:DSPy 与自动提示词工程(2026 年版) 1. 引言 手工编写 Prompt 是一门"炼金术":凭经验调整措辞、添加示例、调整格式,通过反复试错达到满意的效果。这种方式存在三个根本问题: 不可复现:好的 Prompt 高度依赖编写者的经验和直觉 不可扩展:每换一个任务或模型,就要重新调整 不可评估:难以量化 Prompt A 比 Prompt B 好多少...
System Prompt设计模式
System Prompt设计模式 角色定义、约束规范、输出格式与版本管理的工程化设计模式 | 2026-02 一、System Prompt 的重要性 System Prompt 是 LLM 应用中最关键的"代码"——它定义了模型的行为边界、输出格式和交互风格。一个优秀的 System Prompt 应该像一份精准的岗位说明书:明确告诉模型你是谁、你做什么、你不做什么、你怎么做。...
企业级 Prompt 管理平台设计(2026 年版)
企业级 Prompt 管理平台设计(2026 年版) 1. 引言 当企业的 AI 应用从 1 个增长到 100 个,Prompt 管理就不再是"一个文本文件"能解决的问题。散落在代码库、Notion 文档、个人笔记中的 Prompt 带来了一系列痛点:版本混乱、无法追踪效果、缺乏质量保证、知识无法共享。 企业级 Prompt 管理平台的目标是将 Prompt...
创意提示词库:科技与设计融合
创意提示词库:科技与设计融合 引言:当工程思维遇见设计直觉 技术团队与设计团队之间的协作,长期存在一个翻译鸿沟——工程师用逻辑描述需求,设计师用感觉回应方案,两者的语言体系天然不同。AI生成工具的出现,意外地成为了这道鸿沟的桥梁:提示词同时承担了"工程规格"和"设计意图"的双重职能。...
多模态 Prompt 工程:图文音视频提示策略(2026 年版)
多模态 Prompt 工程:图文音视频提示策略(2026 年版) 1. 引言 多模态大模型(Multimodal LLMs)的快速发展正在重新定义 Prompt 工程的边界。传统的 Prompt 工程只处理纯文本输入和输出,而多模态 Prompt 工程需要同时操控文本、图像、音频、视频等多种信号的组合方式。 2024-2026 年间,GPT-4o、Claude 3.5/4、Gemini...
多模态提示词工程
多模态提示词工程 Vision Prompting、音频输入、图文联合推理与多模态 Prompt 设计模式 | 2026-02 一、多模态 LLM 的能力边界 多模态大模型(如 GPT-4o、Claude 3.5、Gemini 2.0)能同时处理文本、图像、音频甚至视频。但"能处理"不等于"能处好"——多模态提示词工程的核心挑战是:如何让模型在不同模态之间建立正确的关联,而不是各看各的。...
多模态提示词设计指南
多模态提示词设计指南 面向视觉、音频、视频的多模态提示词工程实践 多模态 LLM 的能力边界 多模态大模型可以同时处理文本、图像、音频甚至视频输入。但每种模态的处理能力存在显著差异: 多模态能力矩阵(截至 2026 年初): 模型 文本 图像理解 图像生成 音频理解 音频生成 视频理解 视频生成 ─────────────── ──── ──────── ──────── ────────...
大模型幻觉控制的提示词策略
大模型幻觉控制的提示词策略 通过提示词工程降低 LLM 幻觉率:接地、引用、自检与多模型交叉验证 幻觉的本质 LLM 的幻觉(Hallucination)是指模型生成看似合理但实际上不准确或完全虚构的内容。理解幻觉的本质是有效控制它的前提。 幻觉分类 ┌──────────────────────────────────────────────────────────────┐ │ LLM...
思维链提示词:CoT / ToT / GoT 系统化指南(2026 年版)
思维链提示词:CoT / ToT / GoT 系统化指南(2026 年版) 1. 引言 大语言模型(LLM)在面对复杂推理任务时,直接给出答案的准确率往往不理想。2022 年,Google 的 Jason Wei 等人提出了 Chain-of-Thought(CoT)提示技术,通过引导模型"一步步思考"显著提升了推理能力。此后,Tree-of-Thought(ToT)和...
提示词安全:注入攻击与防御
提示词安全:注入攻击与防御 Prompt Injection 攻防全解:攻击向量、防御策略与工程实践 提示词注入的本质 提示词注入(Prompt Injection)是 LLM 时代最核心的安全威胁之一。其本质是:LLM 无法区分"指令"和"数据"。 当用户输入被拼接到提示词中时,恶意输入可以劫持模型的行为。 传统 SQL 注入的类比: SQL 注入: 查询模板:SELECT * FROM...
提示词注入防御工程
提示词注入防御工程 攻击分类、检测方法、防御架构与真实案例的工程化实践 | 2026-02 一、提示词注入的本质 提示词注入(Prompt Injection)是 LLM 应用面临的最严重安全威胁。其本质是:攻击者通过用户输入改变 LLM 的预设行为,类似于 SQL 注入在数据库层面的攻击。 Normal flow: System Prompt (developer) + User Input...
提示词版本控制与AB测试
提示词版本控制与AB测试 Git-based Prompt 管理、在线评估、统计显著性与灰度发布策略 | 2026-02 一、为什么需要版本控制 提示词是 LLM 应用的"源代码",但大多数团队的提示词管理状态是:粘贴在代码里、Slack 里传来传去、改了不知道谁改的、回滚找不到上一版。 Without Version Control: Developer A edits prompt in...
提示词版本管理与 A/B 测试
提示词版本管理与 A/B 测试 将提示词作为代码资产进行版本控制、回归测试和持续优化 为什么提示词需要版本管理 提示词在 LLM 应用中的地位等同于传统软件中的"业务逻辑代码"。一个提示词的微小修改可能导致输出质量的巨大变化。然而,大多数团队对提示词的管理仍然处于"复制粘贴"阶段。 提示词管理的成熟度模型: Level 0: 硬编码 提示词直接写在代码里,散落各处,无版本控制 Level 1:...
提示词管理系统设计与实现
提示词管理系统设计与实现 从版本控制到生产部署:企业级 Prompt 管理系统的架构设计与工程实践 | 2026-02 一、为什么需要提示词管理 当 LLM 应用从原型进入生产,提示词就不再是"一段文字",而是核心业务逻辑的一部分。没有管理系统的提示词面临以下问题: 版本失控:谁改了提示词?改了什么?改坏了怎么回滚? 质量退化:新版本是否比旧版本好?没有对比就没有答案...
提示词链编排:复杂任务的分治策略
提示词链编排:复杂任务的分治策略 Chain-of-Prompts、条件路由、错误传播与 LangChain LCEL 实现 | 2026-02 一、为什么需要提示词链 单个提示词在面对复杂任务时会遇到瓶颈:上下文窗口不够用、指令过于复杂导致遵循率下降、不同子任务需要不同的模型或参数。提示词链(Chain of Prompts)将复杂任务分解为多个简单步骤,每个步骤使用专门优化的提示词。...
结构化提示词的工程化实践
结构化提示词的工程化实践 从自由文本到工程化模板:构建可维护、可测试、可复用的提示词体系 为什么需要结构化提示词 自由文本提示词的三大痛点: 不可预测:同一个意图的不同表述,LLM 可能给出完全不同质量的输出 不可维护:提示词散落在代码各处,修改一个提示词需要搜索整个代码库 不可复用:每个场景都从头写提示词,没有积累和沉淀 结构化提示词的目标:将提示词从"自然语言技巧"转变为"软件工程实践"。...
结构化输出技术:让LLM返回可靠JSON
结构化输出技术:让LLM返回可靠JSON JSON Mode、Function Calling、Schema 验证与容错恢复的工程化实践 | 2026-02 一、为什么需要结构化输出 LLM 的默认输出是自然语言文本。但在工程系统中,下游组件需要的是可解析、可验证、可类型化的结构化数据。非结构化输出导致的问题: 解析失败:JSON 格式错误(多余逗号、未闭合括号) 字段缺失:LLM...
结构化输出控制:JSON Mode 与 Schema 约束(2026 年版)
结构化输出控制:JSON Mode 与 Schema 约束(2026 年版) 1. 引言 大语言模型最初被设计为"自由文本生成器",其输出是非结构化的自然语言。然而在工程实践中,我们几乎总是需要结构化的输出:JSON 对象、数据库记录、API 响应、表格数据。如何可靠地从 LLM 获得结构化输出,是 Prompt 工程中最关键的实用技能之一。 2024-2026...
评估驱动的提示词优化
评估驱动的提示词优化 Eval-First 开发、指标设计、自动评分、人工评估与持续改进闭环 | 2026-02 一、Eval-First 开发哲学 大多数提示词工程的失败模式是:先写 prompt,再想怎么评估,发现评不了就"看看效果还行"就上线了。正确的顺序是反过来的——先定义"什么是好",再去优化 prompt。 Wrong (Prompt-First): Write prompt ->...
AI Agent 开发框架对比:LangGraph vs CrewAI vs AutoGen
AI Agent 开发框架对比:LangGraph vs CrewAI vs AutoGen 作者:Maurice | 灵阙学院 选型背景 2025-2026 年,AI Agent 开发框架从百花齐放走向收敛。对于技术团队来说,选择合适的框架直接影响开发效率和产品质量。本文对比三个主流开源框架的架构设计、适用场景和工程实践。 框架概览 维度 LangGraph CrewAI AutoGen...
AI IDE 工程规范:Cursor Rules 与 Claude Code 实战
AI IDE 工程规范:Cursor Rules 与 Claude Code 实战 作者:Maurice | 灵阙学院 为什么需要规范文件 2023 年以前,我们谈 AI 编程,谈的是"自动补全"。 2025 年,局面已经完全不同。Claude、GPT-4o、Gemini 这些模型的代码能力早已超过大多数初级工程师。Cursor、Claude Code、Windsurf 等 AI IDE...
AI 工作流自动化实战
AI 工作流自动化实战 用 Dify 和 n8n 搭建三个实用 AI 工作流,无需写代码 Maurice | 灵阙学院 前置准备 Docker Desktop 已安装 基本的浏览器操作能力 一个 OpenAI / Claude / 国产大模型 API Key 一、AI 工作流工具全景对比 特性 Dify Coze (字节) n8n Make (Zapier) 定位 AI 应用开发平台 AI...
AI 编程助手横向评测
AI 编程助手横向评测 Maurice | 灵阙学院 2026-02-27 | 评测窗口:2025-09 至 2026-02 评测背景 AI 编程助手已从"自动补全"进化到"自主工程"。本文对五款主流产品进行多维度横向对比,帮助开发者和团队做出选型决策。评测基于公开基准数据、社区反馈和实际使用体验综合判定。 产品概览...
Context Engineering:从提示词到上下文工程
Context Engineering:从提示词到上下文工程 作者:Maurice | 灵阙学院 引言:一个范式正在悄悄替换另一个范式 2023年,"Prompt Engineering"(提示词工程)风靡一时。每个人都在学写更好的提示词,争论零样本还是少样本,研究思维链(Chain-of-Thought)的奇效。 2025年之后,顶级AI工程师开始使用另一个词:Context...
Embedding 向量技术入门与应用
Embedding 向量技术入门与应用 从直觉理解到代码实战,掌握 AI 时代最重要的数据表示技术 Maurice | 灵阙学院 前置准备 Python 3.10+ pip install openai numpy scikit-learn matplotlib 一、什么是 Embedding(向量嵌入) 1.1 直觉解释 Embedding 是把"含义"变成"数字"的技术。...
Function Calling 与工具使用开发指南
Function Calling 与工具使用开发指南 Maurice | 灵阙学院 2026-02-27 什么是 Function Calling Function Calling 让大模型不再只是输出文本,而是能够结构化地调用外部工具。模型根据用户请求决定调用哪个函数、传入什么参数,开发者执行函数后将结果返回模型,模型再基于结果生成最终回答。...
RAG 检索增强生成完全指南
RAG 检索增强生成完全指南 Maurice | 灵阙学院 2026-02-27 为什么需要 RAG 大语言模型有两个核心短板:知识截止日期和幻觉。RAG(Retrieval-Augmented Generation)通过在推理时注入外部知识,让模型基于真实文档回答问题,从根本上缓解了这两个问题。 与微调相比,RAG 不需要重新训练模型,知识更新只需替换文档库,成本低且可审计。...
Token 与分词器工作原理
Token 与分词器工作原理 理解 AI 的"视觉":大模型如何看待你输入的每一个字 Maurice | 灵阙学院 前置准备 Python 3.10+ pip install tiktoken transformers openai 一、什么是 Token Token 是大模型处理文本的最小单位。模型不直接理解文字,而是把文字切分成 Token 后,转换成数字再处理。 1.1 直观示例...
Transformer 架构深度解析
Transformer 架构深度解析 Maurice | 灵阙学院 2026-02-27 一句话理解 Transformer Transformer 的本质是一个"注意力驱动的序列到序列映射器":给定输入序列中的每个位置,它通过注意力机制动态地从所有其他位置收集信息,而不像 RNN 那样被迫按顺序逐步传递。这使得它天然支持并行计算,且能捕获任意距离的依赖关系。 整体架构...
从零搭建你的第一个AI应用
从零搭建你的第一个AI应用 从环境搭建到部署上线,手把手带你完成第一个 AI 聊天应用 Maurice | 灵阙学院 前置准备 Python 3.10+ 一个 OpenAI 或 Anthropic API Key 基本的命令行操作能力 一、搭建 Python 开发环境 创建一个独立的虚拟环境,避免依赖冲突。 # 创建项目目录 mkdir my-first-ai-app && cd...
向量数据库选型指南
向量数据库选型指南 Maurice | 灵阙学院 2026-02-27 为什么需要专用向量数据库 传统数据库按精确匹配设计(WHERE id = 123),而 AI 应用需要按语义相似度检索("找到含义最接近的前 10 条记录")。向量数据库专为高维向量的近似最近邻(ANN)搜索优化,是 RAG、推荐系统、图像检索等 AI 应用的基础设施。 核心索引算法...
多模态 AI 应用开发指南
多模态 AI 应用开发指南 作者:Maurice | 灵阙学院 什么是多模态 AI 多模态 AI(Multimodal AI)是指能够理解和生成多种数据类型的 AI 系统——文本、图像、音频、视频的统一处理。 2024 年以前,不同模态通常需要不同的专用模型: 旧模式(模态隔离): 文本理解 → GPT-4 图像理解 → CLIP / BLIP-2 语音识别 → Whisper 图像生成 →...
大模型微调实战:从 LoRA 到 QLoRA
大模型微调实战:从 LoRA 到 QLoRA Maurice | 灵阙学院 2026-02-27 微调 vs RAG:何时选择微调 维度 RAG 微调 两者结合 知识更新频率 高(实时替换文档) 低(需重新训练) 中 风格/格式控制 弱 强 最强 推理成本 较高(长 context) 较低(知识内化) 中 幻觉控制 强(有据可查) 中(需要高质量数据) 最强 适用场景 知识问答、文档检索...
提示词工程进阶:从 Chain-of-Thought 到 Tree-of-Thought
提示词工程进阶:从 Chain-of-Thought 到 Tree-of-Thought 作者:Maurice | 灵阙学院 提示词工程的三个阶段 阶段一:直接提示(2022 前) 直接向模型提问,依赖模型的"直觉": Q: 小明有 15 个苹果,给了小红 7 个,又买了 3 个,现在有几个? A: 11 个 问题:对于稍复杂的推理任务,直接提示的准确率显著下降。...
本地部署大模型实战:Ollama 指南
本地部署大模型实战:Ollama 指南 在你自己的电脑上运行大语言模型,无需 API Key,完全离线可用 Maurice | 灵阙学院 前置准备 macOS (Apple Silicon 推荐) / Linux / Windows 至少 8GB 内存(运行 7B 模型) 推荐 16GB+ 内存(运行 13B+ 模型) 一、安装 Ollama macOS / Linux 一键安装: curl...
结构化输出实战:让大模型输出可编程的 JSON
结构化输出实战:让大模型输出可编程的 JSON 作者:Maurice | 灵阙学院 前言 大模型最令人头疼的生产问题不是"输出错了",而是"输出了一个几乎正确的 JSON"。 漏了一个逗号,多了个 markdown 代码块围栏,把数字输出成字符串——这类问题不会在开发阶段暴露,专挑凌晨三点生产告警的时候出现。 本文系统梳理结构化输出的三种实现路径、各主流厂商 API 的落地方法、Pydantic...
Prompt Contract v1.1 - 智能体平台结构化合约系统
Prompt Contract v1.1 - 智能体平台结构化合约系统 可校验、可编译、可回放的提示词工程化方案 概述 Prompt Contract v1.1 将传统的"散装提示词"升级为结构化合约,实现: 可校验:三层 Schema 校验(Envelope → Task → Result) 可编译:Prompt Compiler 自动注入 locks、negative、工具配置 可回放:同...
LingQue Studio 智能体平台逐页优化与AI编程提示词(整合版)
逐页优化 & AI 编程提示词 LingQue Studio · 整合 HTML 0)全局 1)工作台 2)智能体列表 3)工作流编排 4)模板市场 5)会话记录 Beta 6)执行日志 7)链路追踪 New 8)测试中心 9)知识库 10)工具箱 11)MCP 服务 12)提示词库 13)模型接入 14)SOTA 榜单 New 15)订阅计划 New 16)租户管理 New 17)审计日志...
智能体平台 Prompt Contract v1.1(YAML/JSON 硬约束 + 编排/校验/编译)
AI 编程指令:Prompt Contract v1.1(全平台 YAML/JSON 硬约束) v1.1 目标: 把“提示词”升级为可校验、可编译、可回放的结构化合约(Contract)。 所有输入/输出只允许严格 YAML 或严格 JSON,否则请求失败。 支持三类智能体:video / image / ppt,统一 Envelope + 任务内 Schema。...
AI 基础
2028 全球智能危机与“幽灵 GDP” | 内参报告 III 期
企业技术 · 深度分析报告 · SPECIAL REPORT 2026 年 2 月 28 日 2028 全球智能危机与“幽灵 GDP” 内参报告 III 期 当 AI 的极致成功成为经济的绞肉机:一份来自未来的思想实验,如何在一夜之间蒸发了华尔街的数十亿市值?Citrini Research 备受争议的“智能替代螺旋”深度拆解。 作者:Maurice |...
AI & Agent 全栈概念速查表 4.0 (50+ 核心概念)
v4.0.0 - 50+ CONCEPTS EXPANDED AI & Agent 全栈概念速查表 全部 (50) 1. LLM 基础 (10) 2. 微调与对齐 (10) 3. Agent 架构 (10) 4. 工具与协议 (10) 5. 推理与工作流 (10) 1. LLM Core SOTA (最先进水平) 在特定任务中取得当前业界最高分数的模型。例如:当前闭源综合 SOTA 是...