Claude Skills 知识提取与报告生成：2026 企业实战指南

Jan 25, 2026

当 Thomson Reuters 使用 Claude 将法律文档研究时间从几小时缩短到几分钟，或者当 eSentire 将威胁分析从五小时压缩到七分钟，同时保持与高级专家 95% 的准确性一致时，他们不仅仅是在实施另一个 AI 工具——他们正在部署一种根本不同的企业知识工作方法。
欢迎来到 Skills 革命。如果你正在构建知识系统、自动化报告或从大量文档中提取见解，Claude Skills 代表了企业如何真正大规模_使用_ AI 的最重大架构转变。这不是关于聊天机器人生成更漂亮的文本。这是关于将你组织的专业知识打包成可重用、可组合的模块，在数千名员工中执行确定性工作流。
让我准确地向你展示这是如何工作的、数据说明了什么，以及前瞻性团队如何已经获得数百万可衡量的回报。

为什么传统知识提取会失败

这是每个人都会遇到的问题：你上传一份 200 页的合同到 AI，要求它提取关键条款，然后……质量下降。你在每次对话中粘贴复杂的指令。你的团队从 Slack 消息中复制提示。没有什么可以扩展。上下文窗口填满。成本激增。用户之间的结果差异很大。
根本问题不是模型能力——而是_架构_。大多数团队将 AI 视为搜索引擎：一次性查询、没有记忆、没有方法论。但知识提取和报告生成不是搜索问题。它们是_工作流_问题，需要一致的程序、领域专业知识和随时间复合的机构知识。
Claude Skills 通过翻转范式来解决这个问题。你不是将指令塞进每个提示（消耗宝贵的上下文标记），而是将专业知识一次性打包成一个 Skill——一个包含指令、脚本和资源的文件夹——Claude 仅在需要时动态加载。
结果不言而喻。实施 Skills 的组织看到 80% 的可衡量 ROI，60% 已经专门使用 Claude 进行数据分析和报告生成。AIA Singapore 自动化了工作流，节省了 500,000 多个员工小时。Zapier 的员工采用率达到 89%，通过 Claude 完成的任务同比增长 10 倍。

渐进式披露架构：为什么它真的有效

Skills 的天才之处在于 Anthropic 所称的”渐进式披露”——一个从根本上优化上下文使用的三层加载系统。
级别 1：元数据（始终加载）
当 Claude 启动时，它只加载每个可用 Skill 的_名称_和_描述_。每个 Skill 大约 100 个标记。你可以安装 50 个 Skills，启动时只消耗 5,000 个标记——不到一页文本。Claude 知道每个 Skill 的存在和何时使用它，但仅此而已。
级别 2：指令（触发时加载）
当你的请求与 Skill 的描述匹配时，Claude 从文件系统读取完整的 SKILL.md 文件。这是程序化知识所在的地方：工作流、最佳实践、逐步指导。通常少于 5,000 个标记。只有这时这些内容才进入上下文窗口。
级别 3+：资源（按需加载）
Skills 可以捆绑额外的材料——参考文档、数据库模式、API 文档、示例输出、可执行脚本。Claude 仅在指令引用它们时才访问这些文件。一个 Skill 可以包含数十个参考文件，在实际需要之前消耗零标记。
这使得这具有变革性：文件系统上的文件在访问之前不消耗上下文。当 Claude 运行 Python 脚本进行数据验证时，脚本的代码永远不会加载到上下文中——只有输出会。这意味着你可以将全面的文档、大型数据集或复杂代码库捆绑到 Skills 中，而不会产生上下文损失。

与传统方法相比，在传统方法中，每一条上下文都在竞争相同的标记预算。使用 Skills，你的知识库在上下文窗口_之外_增长，根据工作流需求有选择地加载。

真实实施：从法律研究到财务分析

让我们看看 2026 年 1 月企业在哪些方面部署 Skills 进行知识提取和报告的具体用例。
Thomson Reuters：法律知识提取
CoCounsel，Thomson Reuters 的由 Claude 提供支持的 AI 法律平台，让律师即时访问 150 年的判例法和 3,000 名领域专家。以前需要数小时手动文档搜索的工作现在在几分钟内完成。秘诀？编码法律研究方法论的 Skills——如何识别相关先例、提取关键裁决、跨多个司法管辖区综合——结合工具使用查询大量法律数据库。
Skill 不仅仅是搜索；它_知道_律师需要如何构建信息。它理解引用格式、司法管辖区层次结构以及如何呈现冲突的判例法。这种程序化知识在数千次查询中保持一致。
eSentire：安全威胁分析
网络安全需要速度和准确性。eSentire 将专家威胁分析从五小时压缩到七分钟——43 倍的加速——同时保持与高级安全分析师 95% 的一致性。
他们的 Skill 编码威胁评估框架：优先考虑哪些指标、如何关联跨系统事件、什么构成可操作情报与噪音。脚本处理确定性操作，如日志解析和时间线重建。Claude 的推理连接人类可能错过的点，但 Skill 确保每个分析都遵循经过验证的方法论。
L’Oréal：对话式分析报告
44,000 名月度用户直接查询数据，而不是等待自定义仪表板，L’Oréal 在对话式分析上实现了 99.9% 的准确性。他们的报告 Skill 将自然语言问题转换为验证的查询，执行分析，并生成符合企业标准的格式化报告。
Skill 捆绑了数据模式、批准的计算方法和可视化模板。当有人问”我们按地区的客户保留率是多少？”时，Claude 不会猜测指标定义——它遵循 Skill 的精确指令，确保每个人看到以相同方式计算的一致数字。

Doctolib：自动化开发报告
医疗保健平台 Doctolib 在其工程团队中推出 Claude Code，功能交付速度提高 40%。他们的项目状态报告 Skill 自动从电子邮件、Slack 频道、会议笔记和项目管理工具中提取更新，创建一个全面的跟踪器，显示谁在做什么、什么被阻止以及当前状态。
以前需要从分散来源手动编译的工作现在自动发生。Skill 知道在哪里查找、每个团队使用什么格式以及如何协调冲突的信息。

构建你的第一个知识提取 Skill

让我们构建一个从研究论文中提取结构化数据的实用 Skill——大多数团队都需要的工作流。我将向你展示实际结构，而不仅仅是概念。
Skill 目录结构：


    
    
    
  research-extractor/
├── SKILL.md (主要指令)
├── EXTRACTION_GUIDE.md (详细方法论)
├── schemas/
│   └── paper_schema.json (输出格式)
└── scripts/
    └── validate_extraction.py (质量检查)

SKILL.md 内容：


    
    
    
  ---
name: research-paper-extractor
description: 从学术论文中提取结构化数据，包括方法论、数据集、结果和局限性。当用户上传研究 PDF 或要求分析科学文献时使用。
---

# 研究论文数据提取

## 目标
将研究论文中的关键信息提取到遵循我们验证模式的结构化 JSON 格式中。

## 工作流
1. **初步评估**
   - 识别论文类型（实证、理论、综述）
   - 定位关键部分：摘要、方法论、结果、讨论

2. **元数据提取**
   - 作者、隶属关系、出版场所
   - 引用计数（如果文档中可用）
   - 出版日期

3. **核心内容提取**
   - 研究问题/假设
   - 方法论：方法、使用的数据集、样本大小
   - 关键发现：具有统计显著性的定量结果
   - 作者承认的局限性
   - 建议的未来工作

4. **质量验证**
   - 运行 validate_extraction.py 以确保模式合规性
   - 标记缺失的关键字段
   - 检查不一致性

5. **输出**
   - 遵循 paper_schema.json 生成结构化 JSON
   - 包含提取值的置信度分数
   - 注意任何模糊的解释

## 特殊情况
**对于提到的数据集：** 提取名称、来源、大小、访问 URL（如果提供）
**对于统计结果：** 捕获精确值和置信区间
**对于局限性：** 直接引用而不是释义

## 参考材料
- 请参阅 EXTRACTION_GUIDE.md 以处理边缘情况
- 咨询 schemas/paper_schema.json 以获取所需的输出格式

schemas/paper_schema.json：


    
    
    
  {
  "paper_id": "string",
  "metadata": {
    "title": "string",
    "authors": ["string"],
    "venue": "string",
    "year": "integer"
  },
  "research": {
    "question": "string",
    "methodology": "string",
    "datasets": [{"name": "string", "size": "string", "source": "string"}],
    "key_findings": ["string"],
    "statistical_significance": "string"
  },
  "limitations": ["string"],
  "future_work": ["string"],
  "confidence_scores": {
    "methodology": "float",
    "results": "float",
    "limitations": "float"
  }
}

scripts/validate_extraction.py：


    
    
    
  import json
import sys

def validate_schema(data, schema):
    """根据所需模式验证提取的数据"""
    required_fields = ['paper_id', 'metadata', 'research']
    missing = [f for f in required_fields if f not in data]

    if missing:
        return False, f"缺少必需字段：{missing}"

    # 检查嵌套要求
    if 'key_findings' not in data['research'] or not data['research']['key_findings']:
        return False, "未提取关键发现"

    return True, "模式验证通过"

if __name__ == "__main__":
    with open(sys.argv[1], 'r') as f:
        data = json.load(f)

    valid, message = validate_schema(data, None)
    print(message)
    sys.exit(0 if valid else 1)

在实践中的工作方式：
当你上传一篇研究论文并说”使用研究提取器 skill 提取关键信息”时：

1. Claude 扫描可用的 Skills，将”研究论文提取器”与你的请求匹配
2. 加载 SKILL.md 指令（~3,000 个标记）
3. 系统地遵循 5 步工作流
4. 当它达到验证时，通过 bash 运行 Python 脚本
5. 仅当验证通过时，才输出结构化 JSON
6. 如果你询问边缘情况，Claude 根据需要读取 EXTRACTION_GUIDE.md

渐进式披露意味着提取指南和模式消耗零标记，除非 Claude 实际需要它们。验证脚本代码永远不会进入上下文——只有其通过/失败输出。

高级模式：用于报告生成的可组合 Skills

当堆叠时，Skills 变得呈指数级更强大。这是 Bridgewater Associates 用于投资分析的真实模式（他们报告了从 Claude 实施中获得的 9000 万美元以上的可衡量业务收益）。
Skill 堆栈架构：


    
    
    
  1. data-ingestion-skill
   └── 从多个来源提取财务数据、新闻、记录

2. financial-analysis-skill
   └── 计算指标、识别趋势、标记异常

3. market-context-skill
   └── 将公司业绩与行业/宏观趋势关联

4. report-generation-skill
   └── 将发现综合成格式化的投资备忘录

Claude 自动协调使用哪些 Skills 以及以什么顺序使用。请求：”分析公司 X 并生成投资备忘录。”Claude 识别这需要多个 Skills，按顺序调用它们，并在它们之间传递输出。

执行时，Claude：

1. 检索先前 Skills 的输出（数据已提取、分析）
2. 系统地遵循报告结构
3. 调用品牌指南 Skill 以获取格式规范
4. 调用内置 pptx Skill 生成演示文稿
5. 根据源数据验证数字
6. 输出准备分发的专业投资备忘录

整个过程——从原始数据到格式化报告——在几分钟内发生，而不是几小时，具有手动过程无法匹配的一致性。

API 实施：生产级知识系统

对于企业部署，真正的力量来自 Claude API，你可以在其中以编程方式大规模控制 Skills。
设置要求：
你需要三个测试版标头：

• code-execution-2025-08-25 - Skills 在代码执行容器中运行
• skills-2025-10-02 - 启用 Skills 功能
• files-api-2025-04-14 - 文件上传/下载所需

通过 API 创建自定义 Skill：


    
    
    
  import anthropic

client = anthropic.Anthropic(api_key="your-api-key")

# 创建 skill
skill = client.beta.skills.create(
    display_title="Financial Statement Analyzer",
    files=[
        ("financial-analyzer/SKILL.md", open("financial-analyzer/SKILL.md", "rb"), "text/markdown"),
        ("financial-analyzer/gaap_standards.json", open("financial-analyzer/gaap_standards.json", "rb"), "application/json"),
        ("financial-analyzer/analyze.py", open("financial-analyzer/analyze.py", "rb"), "text/x-python"),
    ],
    betas=["skills-2025-10-02"]
)

print(f"Created skill: {skill.id}")
print(f"Latest version: {skill.latest_version}")

在消息中使用 Skill：


    
    
    
  response = client.messages.create(
    model="claude-sonnet-4.5-20250520",
    max_tokens=4096,
    tools=[{"type": "code_execution_20250825", "name": "code_execution"}],
    betas=["code-execution-2025-08-25", "skills-2025-10-02", "files-api-2025-04-14"],
    container={
        "skills": [
            {
                "type": "custom",
                "skill_id": skill.id,
                "version": "latest"
            }
        ]
    },
    messages=[{
        "role": "user",
        "content": "分析附加 PDF 中的 Q4 财务报表并标记任何 GAAP 合规性问题。"
    }]
)

性能优化：真正有效的标记经济学

这是 Skills 提供可衡量成本节省的地方。传统方法为重复指令消耗大量上下文。Skills 完全翻转了这一点。
Skills 之前：标记税
每个需要领域专业知识的对话都从零开始：

• 上传 15 页品牌指南：~10,000 个标记
• 粘贴格式要求：~2,000 个标记
• 解释计算方法：~3,000 个标记
• 提供示例输出：2,000 个标记
总计每次对话：17,000 个标记仅用于指令

在 50 名员工中每天 100 次对话：每天 8500 万个标记的纯开销。使用 Claude Sonnet 4.5，每百万输入标记 3 美元，这是每天 255 美元或每年 93,000 美元燃烧在重复上下文上的标记。
Skills 之后：渐进式披露

• 一次加载的 Skill 元数据：100 个标记
• 触发时每次对话加载的指令：~5,000 个标记
• 仅在需要时加载的参考材料：0 个标记（大多数对话）

相同的 5,000 次对话：总共 2500 万个标记，每天节省 6000 万个标记。这是每天 180 美元或每年 65,700 美元节省在相同工作上。
但真正的 ROI 不是标记节省——而是_速度_和_质量_。AIA Singapore 不仅节省了资金；他们消除了 500,000 个员工小时。Doctolib 的功能交付速度提高了 40%。这些是业务级别的回报，而不是项目优化。

RAG 集成模式：当上下文超出限制时

Skills 与检索增强生成（RAG）完美配合，用于真正庞大的知识库。这是企业正在使用的架构模式。
混合方法：

1. 向量数据库层：将你的完整知识语料库——文档、研究论文、历史报告——存储在向量数据库中，如 Pinecone 或 Weaviate。使用 Claude 的首选嵌入模型嵌入文档。
2. 检索 Skill：创建一个知道_如何_有效查询向量数据库的 Skill
3. 分析 Skills：对检索的上下文进行操作的独立 Skills——财务分析、竞争对手研究、监管合规检查等。

当用户询问：”2025 年第三季度有哪些监管变化影响了我们的产品战略？”

• Claude 调用知识检索 Skill
• Skill 使用工具调用查询向量数据库和关键字索引
• 从监管文件、战略文档和会议笔记中检索相关摘录
• 将组装的上下文传递给监管分析 Skill
• 该 Skill 解释发现并生成结构化响应

知识库可以是 TB 级的。Skills 每次查询只提取所需的几 KB。Claude 的 100 万标记上下文窗口（大约 750,000 个单词）为即使是复杂的多文档分析提供了充足的空间。

衡量成功：重要的指标

部署 Skills 进行知识提取和报告的企业跟踪特定的 KPI。以下是真正重要的：
速度指标：

• 首次草稿时间：从请求到可用输出需要多长时间？目标：减少 80%
• Skills 之前：综合报告需要 4-6 小时
• Skills 之后：30-60 分钟

质量指标：

• 准确率：对于提取的数据，信息正确的频率是多少？目标：>95%
• L’Oréal 在分析查询上实现了 99.9%
• eSentire 与专家分析达到 95% 的一致性

业务影响指标：

• 每位员工每周节省的小时数：直接生产力增益。目标：5+ 小时
• AIA Singapore：整个组织节省了 500,000 个员工小时
• 经济价值创造：启用的收入、避免的成本。目标：12 个月内 ROI >300%
• Bridgewater Associates：9000 万美元以上的可衡量收益

常见陷阱及如何避免

陷阱 1：过度指定指令
将 Skills 视为详尽手册的团队：20 页 SKILL.md 文件试图涵盖每个边缘情况。这违背了渐进式披露。
修复： 保持 SKILL.md 专注于核心工作流（最多 5-10 页）。将边缘情况、详细参考和示例移到单独的文件中。Claude 仅在需要时加载。主要指令应该是路线图，而不是百科全书。
陷阱 2：忽视可执行脚本
试图让 Claude 通过标记生成计算复杂公式或执行精确数据转换。这引入了幻觉风险并不必要地消耗标记。
修复： 为确定性操作捆绑 Python 脚本。财务计算、数据验证、格式转换——任何需要精确可重复性的东西都应该是代码，而不是提示。脚本更可靠，它们的代码永远不会进入上下文。
陷阱 3：模糊的 Skill 描述
诸如”帮助处理文档”或”处理数据”之类的描述。Claude 无法有效地将这些与用户请求匹配。
修复： 包括 Skill 做什么_和_何时使用：”从学术研究论文中提取结构化数据，包括方法论、数据集和结果。当用户上传研究 PDF 或要求分析科学文献时使用。

六周推出：从试点到生产

基于成功的企业实施，这是在整个组织范围内推出 Skills 的经过验证的时间表：
第 1-2 周：基础和用例选择

• 每个团队识别 2-3 个高影响用例（报告生成、数据提取、合规性检查）
• 构建专注于核心工作流的初始 Skills，而不是边缘情况
• 使用适当的测试版标头设置 Claude API 访问
• 建立护栏：PII 处理、客户机密保护、监管合规性、批准的数据源、引用要求

第 3-4 周：试点部署

• 每个团队部署到 5-10 个用户（高级用户和怀疑论者的混合）
• 在需要的地方为共享上下文启用 Claude Projects
• 提供有关何时/如何调用 Skills 的培训
• 每天收集定性反馈
• 监控使用分析：调用频率、错误率、节省时间

第 5 周：测量和迭代

• 分析定量指标：首次草稿时间、审查周期、缺陷率、具有可接受引用的输出百分比
• 与试点用户进行结构化访谈
• 识别快速胜利（产生重大改进的简单修复）
• 根据实际使用模式完善 Skill 指令
• 记录从试点中出现的最佳实践

第 6 周：加固和扩展

• 实施验证改进
• 为常见故障模式添加错误处理
• 创建 Skill 使用文档和示例
• 采用分阶段方法向完整团队推出
• 建立持续维护计划

发布后：持续改进

• 每周指标审查：跟踪采用、质量、业务影响
• 每月 Skill 性能分析：哪个需要优化？
• 季度战略评估：新用例、ROI 验证、扩展规划

关键成功因素：高管赞助。最高 ROI 的实施有 C 级拥护者，他们将 Skills 与战略目标联系起来，并让团队对采用负责。

2026 年趋势：这将走向何方

基于当前的企业部署和 Anthropic 的路线图，预计在 2026 年会有这些发展：
多代理工作流
Skills 越来越多地协调多个专业代理。一个 Skill 可能协调一个收集数据的研究代理、一个处理它的分析代理和一个生成输出的报告代理——每个都有独特的工具和上下文，但由总体 Skill 方法论统一。
语音集成
Skills 的本机语音 I/O 即将推出到 Claude Desktop。从现场研究中口述发现，让 Claude 大声朗读草稿以便用耳朵编辑，并在引用项目的 Skills 的同时进行实时语音对话。这从”向 AI 打字”转变为”与 AI 作为语音伙伴一起思考”。
Skills 市场
Anthropic 于 2025 年 12 月推出了 Skills Directory，其中包含来自 Notion、Figma、Atlassian、Canva 等合作伙伴构建的 Skills。预计到 2026 年中期将出现完整的市场经济：免费社区 Skills、高级行业特定包（法律、医疗、金融）以及 Skill 创建者的收入分享。
开放标准可移植性
Anthropic 将 Agent Skills 发布为跨平台可移植性的开放标准。Skills 不仅可以在 Claude 上运行，还可以在兼容的 AI 平台上运行。构建一次，随处部署——类似于 Docker 容器如何彻底改变软件部署。
扩展思考集成
Claude 4 引入了扩展思考——模型现在可以在其内部推理过程中使用工具。Skills 将利用这一点进行复杂的多步分析，其中 Claude 需要在推理和工具使用之间迭代交替。预计 Skills 将处理越来越复杂的分析工作流。
记忆增强 Skills
记忆工具（随 Sonnet 4.5 发布）让 Claude 跨会话存储和检索信息。Skills 将随着时间的推移建立机构知识：学习你团队的偏好、记住过去的决定并根据历史结果建议改进。这创造了真正”了解”你组织的 AI。

底线：为什么这现在很重要

如果你正在从文档中提取知识、生成报告或构建需要_思考_信息的系统——而不仅仅是检索它——Claude Skills 代表了相对于传统方法的阶跃函数改进。
证据很清楚：80% 的可衡量 ROI，从几小时到几分钟的时间节省，在特定领域从人类水平到超人的质量改进。但真正的机会不是效率——而是_能力_。
经济上不可行的任务变得常规。需要高级专家的分析应该对每个员工都可用。被困在 PDF 和电子邮件线程中的知识成为可查询的机构记忆。现在获得这一优势的组织将随着 Skills 的成熟和扩散而获得复合收益。
从小开始。选择一个高摩擦的知识工作流。构建一个 Skill。衡量影响。迭代。在 2026 年 1 月做这件事的团队将是到年底重塑其行业的团队。
工具已准备好生产。架构已得到证明。问题不是这种方法是否有效——数据明确地回答了这个问题。问题是：在你的竞争对手之前，你能多快部署它？

AI拉呱-洞察AI前沿

Discussion about this post

Ready for more?