AI智能体多格式接口设计：一个URL实现HTML、JSON、Markdown与A2A卡片

半泽和莉娜

552人浏览 · 2026-05-27 11:09:35

半泽和莉娜 · 2026-05-27 11:09:35 发布

1. 项目概述：一个链接，四种形态，开启智能体交互新范式

最近在折腾AI智能体（Agent）的部署和分享时，我遇到了一个挺普遍但很烦人的问题：怎么才能让我的智能体被不同场景、不同技术背景的人方便地使用和集成？给开发者看，他们可能需要一个结构清晰的API文档（JSON）；给产品经理或运营同事看，他们可能想要一个能直接点击测试的网页（HTML）；而我自己写技术笔记或者分享到社区时，又希望是格式优雅、便于阅读的Markdown。难道要为同一个智能体维护三四个不同的入口和文档吗？这显然不现实。

“One URL for Your AI Agent”这个项目，正是为了解决这个痛点而生。它的核心思想极其简洁有力：你只需要一个URL，就能动态地、按需地获取你的AI智能体的四种不同形态——供人交互的HTML页面、供机器调用的JSON接口、供文档阅读的Markdown说明，以及一个新兴的、用于智能体间发现的A2A（Agent-to-Agent）卡片。这不仅仅是技术上的“偷懒”，更是一种面向未来人机协作与机机协作范式的优雅设计。它让智能体真正成为了一个可随处嵌入、按需适配的“服务单元”，极大地降低了使用和集成的门槛。

无论你是独立开发者想分享自己的创作，还是团队内部需要统一智能体的对接规范，这个“一个链接，四种形态”的方案都值得你深入了解。接下来，我将从设计思路、核心实现、到具体的避坑经验，为你完整拆解如何构建这样一个多功能智能体端点。

2. 核心设计思路与架构拆解

2.1 为什么是“四种形态”？—— 场景驱动的接口设计

在构思这个项目时，首要任务是明确每种输出形态所服务的具体场景和用户。这不是拍脑袋决定的，而是基于实际工作流中遇到的真实需求。

HTML (Human-Friendly Interface) ：这是面向最终用户或测试人员的门户。一个精心设计的HTML页面可以直观地展示智能体的功能、提供输入表单、并实时展示交互结果。它降低了技术门槛，让不懂API调用的人也能轻松体验智能体的能力。在设计上，这个HTML页面应该足够轻量、响应式，并且能清晰引导用户完成一次完整的交互。
JSON (Machine-Readable API) ：这是面向开发者或其他系统进行集成的标准接口。JSON格式严格定义了请求和响应的数据结构，是程序化调用的基石。一个好的JSON接口应该遵循RESTful或类似的设计原则，包含清晰的端点、HTTP方法、状态码以及详尽的错误信息。
Markdown (Documentation & Sharing) ：这是面向开发者社区、技术文档或内部知识库的载体。Markdown格式易于编写、版本控制，并且能被GitHub、GitLab、Notion等众多平台完美渲染。通过一个URL直接获取智能体的Markdown文档，意味着你的文档永远是最新的，且分发极其方便。
A2A Card (Agent Discovery Metadata) ：这是一个相对前沿但至关重要的概念。随着AI智能体生态的发展，智能体之间需要相互发现、理解对方的能力并安全地发起协作。A2A卡片是一种标准化的元数据描述文件（通常也是JSON格式，但遵循特定schema），它包含了智能体的名称、描述、能力列表、输入输出格式、调用端点、认证方式等。这相当于智能体的“数字名片”或“服务注册信息”。

注意：A2A卡片的格式目前还没有全球统一的标准（类似OpenAPI之于REST API），但已有一些社区提案和平台规范（如AutoGPT的Agent Protocol雏形、部分AI平台的自定义格式）。在实现时，你可以选择遵循某个新兴标准，或者先定义自己团队内部的规范，但务必保持其结构化和可扩展性。

2.2 技术架构选型：如何用一个URL服务多种内容？

实现“一个URL，多种响应”的核心技术在于HTTP协议的内容协商机制。主要有两种主流方案：

方案一：基于 Accept 请求头的协商 这是最符合HTTP规范、也最优雅的方式。客户端在请求头中通过 Accept 字段声明它希望接收的内容类型（MIME type）。

Accept: text/html -> 返回HTML页面。
Accept: application/json -> 返回JSON数据。
Accept: text/markdown -> 返回Markdown文档。
Accept: application/vnd.a2a+json -> 返回A2A卡片（这里 vnd.a2a+json 是一个示例的自定义MIME类型，代表供应商特定的JSON格式）。

服务器端解析这个头部，并返回对应的内容。对于不提供 Accept 头的普通浏览器请求，默认返回HTML。

方案二：基于URL路径或查询参数的协商 这种方式更直观，易于调试和直接访问。

/agent -> 默认返回HTML。
/agent?format=json -> 返回JSON。
/agent.md -> 返回Markdown（通过服务器路由规则实现）。
/agent/.well-known/a2a-card.json -> 返回A2A卡片（这是一种约定俗成的放置元数据文件的方式）。

两种方案的取舍：

方案一（Accept头） 更“纯粹”，对API客户端友好，但直接浏览器访问时需通过开发者工具修改请求头测试，对普通用户不直观。
方案二（URL参数/路径） 对人和机器都友好，易于手动测试和链接分享，但URL看起来不那么“干净”。

我的实践建议：两者结合。 优先支持 Accept 头以满足规范的API客户端，同时兼容一个简单的查询参数（如 ?format=json ）作为降级方案和调试入口。这样既保证了规范性，又提升了易用性。

2.3 安全与性能考量

在设计之初就必须考虑：

认证与授权 ：JSON API和A2A卡片可能涉及敏感信息。需要设计API密钥、OAuth等机制。对于公开智能体，可以区分只读的A2A卡片和需要认证的交互API。
速率限制 ：防止恶意爬虫或滥用，尤其是对JSON API端点。
缓存策略 ：HTML、Markdown和A2A卡片的内容不常变化，可以设置较长的缓存时间（如 Cache-Control: public, max-age=3600 ），而JSON API的响应可能每次不同，缓存策略需更谨慎。
CORS（跨域资源共享） ：如果你的智能体需要被前端应用跨域调用，必须在JSON API的响应头中正确配置 Access-Control-Allow-Origin 。

3. 核心实现细节与实操要点

3.1 后端框架与路由设置

以使用Python的FastAPI框架为例，它的依赖注入和响应模型非常适合实现这个模式。

from fastapi import FastAPI, Request
from fastapi.responses import HTMLResponse, JSONResponse, PlainTextResponse
from pydantic import BaseModel
from enum import Enum

app = FastAPI(title="One-URL AI Agent")

# 定义你的智能体核心逻辑
class AgentRequest(BaseModel):
    query: str

class AgentResponse(BaseModel):
    answer: str
    reasoning: str = None

class FormatType(str, Enum):
    HTML = "html"
    JSON = "json"
    MARKDOWN = "markdown"
    A2A = "a2a"

def call_agent_logic(query: str) -> AgentResponse:
    # 这里是你的AI智能体核心逻辑，调用LLM等
    # 模拟返回
    return AgentResponse(answer=f"Processed: {query}", reasoning="Simulated reasoning.")

# 核心：单一端点，多格式响应
@app.get("/agent")
async def serve_agent(
    request: Request,
    query: str = "",
    format: FormatType = None
):
    # 1. 获取请求的Accept头部
    accept_header = request.headers.get("accept", "")
    
    # 2. 确定最终响应格式（优先级：查询参数 > Accept头 > 默认HTML）
    determined_format = format
    if not determined_format:
        if "application/json" in accept_header:
            determined_format = FormatType.JSON
        elif "text/markdown" in accept_header:
            determined_format = FormatType.MARKDOWN
        elif "application/vnd.a2a+json" in accept_header:
            determined_format = FormatType.A2A
        else:
            determined_format = FormatType.HTML # 默认

    # 3. 调用智能体逻辑（如果提供了查询参数）
    agent_response = None
    if query:
        agent_response = call_agent_logic(query)

    # 4. 根据格式生成响应
    if determined_format == FormatType.JSON:
        if agent_response:
            return JSONResponse(content=agent_response.dict())
        else:
            # 返回API描述信息
            return JSONResponse(content={"endpoint": "/agent", "method": "GET", "parameters": {"query": "string", "format": "optional"}})
    
    elif determined_format == FormatType.HTML:
        html_content = f"""
        <!DOCTYPE html>
        <html><body>
            <h1>My AI Agent</h1>
            <form>
                <input type="text" name="query" value="{query}" placeholder="Ask me anything...">
                <button type="submit">Submit</button>
            </form>
            <div id="result">
                {f'<p><strong>Answer:</strong> {agent_response.answer}</p>' if agent_response else ''}
            </div>
        </body></html>
        """
        return HTMLResponse(content=html_content)
    
    elif determined_format == FormatType.MARKDOWN:
        md_content = f"""# My AI Agent
**Endpoint**: `GET /agent`
**Description**: This is a versatile AI agent that can be accessed in multiple formats.
## Usage
- Add `?format=json&query=your_question` for API access.
- Use this URL directly in your browser for an interactive UI.
## Example Response
```json
{agent_response.dict() if agent_response else '{"answer": "..."}'}

    """
    return PlainTextResponse(content=md_content, media_type="text/markdown")

elif determined_format == FormatType.A2A:
    a2a_card = {
        "name": "My AI Agent",
        "version": "1.0.0",
        "description": "A versatile agent that demonstrates the one-URL pattern.",
        "capabilities": ["qa", "reasoning"],
        "endpoint": "https://your-domain.com/agent",
        "input_schema": {"type": "object", "properties": {"query": {"type": "string"}}},
        "output_schema": {"type": "object", "properties": {"answer": {"type": "string"}, "reasoning": {"type": "string"}}},
        "authentication": "none" # 或 "api_key", "oauth"
    }
    return JSONResponse(content=a2a_card, media_type="application/vnd.a2a+json")


**关键点解析：**
1.  **路由**：只有一个 `/agent` 端点。
2.  **格式判断逻辑**：优先检查 `format` 查询参数，如果没有，则解析 `Accept` 请求头。这提供了最大的灵活性。
3.  **响应生成**：根据判断出的格式，使用不同的响应类（`HTMLResponse`, `JSONResponse`, `PlainTextResponse`）并设置对应的 `Content-Type`。
4.  **A2A卡片**：这里定义了一个简单的卡片结构。在实际应用中，你可能需要参考更详细的规范，包括版本、作者、许可证、费率限制等元数据。

### 3.2 前端HTML页面的增强设计

上面的示例HTML非常基础。在实际项目中，这个HTML页面是智能体的“门面”，值得精心设计。

*   **实时交互**：使用JavaScript实现无刷新提交和结果展示，提升用户体验。
*   **格式切换器**：可以在页面上添加一个下拉菜单，让用户快速切换到查看JSON、Markdown或A2A卡片格式，这实际上是通过修改 `window.location` 添加 `?format=` 参数来实现的，非常直观。
*   **嵌入示例代码**：在HTML页面中提供一个“嵌入代码”区域，展示如何用curl、Python requests或JavaScript fetch来调用该智能体的JSON API，这对开发者极其友好。

```html
<!-- 在HTML页面中添加一个简单的交互示例 -->
<script>
async function submitQuery() {
    const query = document.getElementById('queryInput').value;
    const response = await fetch(`/agent?format=json&query=${encodeURIComponent(query)}`);
    const data = await response.json();
    document.getElementById('jsonResult').textContent = JSON.stringify(data, null, 2);
}
</script>

3.3 A2A卡片的标准化探索

A2A卡片是智能体互联的关键。虽然标准未统一，但我们可以借鉴成熟的经验：

参考现有提案 ：关注像 Agent Protocol 、 OpenAI的GPT Action Manifest （用于GPTs）或 Claude的Tool Use 等设计。它们都定义了类似的结构：名称、描述、输入模式、输出模式、端点等。
定义核心字段 ：无论遵循哪种规范，以下字段通常是必需的：
- name , description , version
- input_schema : 遵循JSON Schema描述输入参数。
- output_schema : 遵循JSON Schema描述输出结构。
- endpoint : 调用地址。
- authentication : 认证方式描述。
提供发现端点 ：一个常见的做法是将A2A卡片放在一个固定的、众所周知的路径下，例如 /.well-known/ai-agent.json 或 /agent/.well-known/card.json 。这样其他智能体或平台可以通过遍历这个固定路径来发现你的智能体能力。

4. 部署、测试与集成实战

4.1 部署方案选择

你需要一个支持动态内容生成的后端服务器来托管这个服务。

云服务器/容器 ：将上述FastAPI应用打包成Docker容器，部署到AWS ECS、Google Cloud Run、Azure Container Instances或任何VPS上。这是最灵活的方式。
Serverless函数 ：非常适合轻量级、按需使用的智能体。你可以将核心逻辑部署为AWS Lambda、Google Cloud Functions或Vercel Serverless Function。 这里有一个关键点 ：Serverless函数通常由一个主函数处理所有路由，你需要在这个函数内部实现我们上面提到的格式路由逻辑。
AI Agent平台 ：一些新兴的AI Agent托管平台（如 Braintrust 、 Cognigy 等）可能原生支持多格式输出，或者允许你通过自定义Webhook端点来实现此模式。

部署注意事项：

环境变量 ：将API密钥、模型端点等敏感信息配置为环境变量，不要硬编码在代码中。
域名与SSL ：为你的服务配置一个清晰的域名（如 agent.yourcompany.com ）并启用HTTPS，这对于建立信任和方便调用至关重要。
健康检查 ：为你的部署配置一个 /health 端点，返回简单的状态信息，便于运维监控。

4.2 完整测试流程

确保你的“一个链接”在各种场景下都能正确工作。

测试场景	方法	预期结果
浏览器默认访问	直接打开 `https://your-domain.com/agent`	看到美观的HTML交互界面
获取JSON API	`curl -H "Accept: application/json" https://your-domain.com/agent` 或浏览器访问 `https://your-domain.com/agent?format=json`	返回JSON格式的API描述或智能体响应
获取Markdown文档	`curl -H "Accept: text/markdown" https://your-domain.com/agent`	返回格式良好的Markdown文档
获取A2A卡片	`curl -H "Accept: application/vnd.a2a+json" https://your-domain.com/agent`	返回结构化的A2A元数据JSON
带查询的交互	在HTML页面输入文本提交，或调用 `curl "https://your-domain.com/agent?format=json&query=Hello"`	JSON响应中包含智能体对“Hello”的处理结果
错误处理	访问不支持的格式，如 `?format=txt`	返回清晰的错误信息（如400 Bad Request）或回退到默认格式

4.3 与其他系统集成

这个模式的强大之处在于其无缝集成能力。

集成到开发文档 ：在项目的README.md中，直接引用 https://your-domain.com/agent?format=markdown ，你的文档会自动保持更新。
集成到内部工具 ：内部的数据分析平台或仪表盘可以直接通过JSON API调用你的智能体，获取结构化数据。
被其他智能体发现 ：当你的智能体A2A卡片发布后，其他智能体可以通过定期爬取 /.well-known/ 路径或接收你的注册信息，将你的能力纳入其协作网络。例如，一个“调度智能体”可以根据任务类型，自动发现并调用你这个“专业分析智能体”。
嵌入到聊天界面 ：许多聊天平台（如Slack、Discord）支持Webhook或小程序。你可以创建一个轻量级适配器，将用户消息转发到你的智能体JSON API，并将结果返回聊天室。

5. 常见问题、排查技巧与进阶思考

5.1 实战中踩过的坑

Accept头解析的优先级问题 ：浏览器发出的请求， Accept 头通常包含多种类型，如 text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 。你的解析逻辑需要正确处理质量值（ q 参数）。简单实现可以按顺序检查是否包含关键词（如 application/json ），但更健壮的做法是使用专门的库（如Python的 werkzeug.http ）来解析和匹配。
缓存导致的格式错乱 ：如果你在调试时通过查询参数切换格式，但浏览器或CDN缓存了之前格式的响应，可能会导致看不到最新变化。 务必在开发阶段禁用浏览器缓存，并在部署后为不同格式设置差异化的缓存键 。
A2A卡片的安全性问题 ：将智能体的能力描述、输入输出模式完全公开，可能存在信息泄露风险（例如，暴露了内部数据结构）。对于敏感智能体，可以考虑对A2A卡片端点进行基础认证，或者只公开部分非敏感的能力描述。
API版本管理 ：当你的智能体逻辑升级，输入输出格式发生变化时，如何保证旧客户端兼容？一个建议是在URL中嵌入版本号，如 /v1/agent ，并在A2A卡片中明确声明支持的API版本。

5.2 性能优化技巧

为静态内容使用CDN ：HTML、Markdown和A2A卡片的内容相对静态，可以推送到CDN（如Cloudflare、AWS CloudFront），极大减轻源站压力，加速全球访问。
智能体逻辑异步化 ：如果智能体处理耗时较长（如调用大语言模型），不要让HTTP请求一直等待。可以采用“请求-响应-轮询”或“Webhook回调”模式。JSON API可以先返回一个任务ID，客户端再通过另一个端点查询结果。
响应压缩 ：启用Gzip或Brotli压缩，特别是对HTML和JSON响应，能有效减少传输数据量。

5.3 未来演进与扩展

“One URL”模式是一个强大的起点，你可以在此基础上进行丰富扩展：

增加更多格式 ：比如 ?format=openapi 返回完整的OpenAPI/Swagger规范，方便开发者导入到Postman等工具； ?format=widget 返回一段可直接嵌入第三方网站的JavaScript代码。
动态能力发现 ：让A2A卡片不是静态的，而是能根据当前系统状态、负载或配置动态生成，反映智能体实时可用的能力。
组合智能体 ：构建一个“网关智能体”，其本身也遵循“One URL”模式，但它内部可以根据A2A卡片动态调用其他子智能体，形成可编排的智能体网络。

从我自己的实践来看，采用“One URL for Your AI Agent”模式后，最直观的感受是协作效率的提升。再也不用回答“这个智能体的接口文档在哪？”、“有没有demo页面？”这类重复问题。一个链接甩过去，对方各取所需。这种设计体现的是一种“以用户（包括人和机器）为中心”的接口哲学，它让技术资产变得更友好、更易流通。在AI智能体逐渐成为基础组件的今天，花点时间为其打造这样一个多功能入口，绝对是值得的投入。

CSDN-OPC开发者社区

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容，并连接云服务、办公空间等稀缺资源，助你专注创造，无忧运营。

更多推荐

从零搭建 AI 智能体平台：AgentForge 完整架构解析与实战

CSDN-OPC开发者社区

Hermes - AI Agent 运行时框架详细介绍

摘要： Hermes是由Nous Research开源的个人AI Agent运行时框架，定位为"可自我进化的自主智能体"，主要功能是为编码Agent提供记忆管理、技能沉淀和后台自动化支持。其核心设计为三层结构化记忆体系（核心置顶记忆、会话检索记忆、技能化长期记忆），通过本地存储和检索实现跨会话上下文持久化，并能从执行经验中自动优化技能。需搭配大模型API（如Claude Code）使用，适合个人长

CSDN-OPC开发者社区

Paperclip - 多Agent编排管理平台详细介绍

Paperclip 是一个开源的多 Agent 编排管理平台，旨在提供企业级的 AI Agent 组织化治理能力。作为"零人力公司"的编排器，它不直接参与编码，而是专注于团队调度、预算控制、权限管理和审计追踪等治理功能。该平台采用分层架构设计，上层作为控制平面管理多个执行层的 Agent 团队（如需求分析、代码开发、测试等角色），支持定时、Webhook、API 等多种触发方式。核心功能包括：