探索群体智能在提示优化中的应用，提示工程架构师的未来之路

假设我们要解决一个文本分类任务：将用户的评论分为“正面”、“负面”、“中性”三类。我们需要优化少样本提示中的示例，让LLM的分类准确率最高。每个个体（少样本提示）由3个示例组成，每个示例是“评论+标签”的组合。# 一个个体（少样本提示）{"comment": "这家店的饭菜很可口，服务也很好！", "label": "正面"},{"comment": "今天下雨了，心情有点差。", "label"

杨正康396

1040人浏览 · 2025-08-28 20:25:08

杨正康396 · 2025-08-28 20:25:08 发布

《群体智能赋能提示优化：从经验驱动到协同进化的提示工程新范式》

引言：为什么你的提示总像“猜谜游戏”？

作为一名提示工程师，你是否遇到过这样的困境？

为一个分类任务写了10版提示，结果要么漏了边缘案例，要么对长尾需求识别不准；
对话场景中，用户的问题越发散，提示的效果越不稳定，像“拆盲盒”一样看运气；
手动优化提示时，明明改了一个词，效果却忽上忽下，根本找不到规律；
面对海量用户需求，手动调整提示的效率比“挤牙膏”还慢……

这些问题的根源，其实是单一提示难以覆盖复杂场景的多样性需求，而手动优化的“试错法”无法高效探索庞大的提示空间。

有没有一种方法，能让提示像“蚁群找食物”一样，通过群体协同自动找到最优解？
有没有一种技术，能让提示像“遗传进化”一样，在迭代中不断适应用户需求？

答案是：群体智能（Swarm Intelligence）。

本文将带你走进群体智能与提示优化的交叉领域，用遗传算法、蚁群算法等经典群体智能技术，解决提示工程中的“痛点”问题。读完本文，你将学会：

用群体智能算法自动优化提示，替代低效的手动调整；
让提示适应动态用户需求，实现“自我进化”；
理解提示工程架构师的未来方向——从“提示编写者”到“群体智能系统设计者”。

准备工作：你需要知道这些

在开始之前，确保你具备以下基础：

1. 技术栈/知识储备

LLM基础：了解GPT-4、Claude 3等大语言模型的基本原理（如生成式任务、对话交互）；
提示工程基础：掌握零样本（Zero-shot）、少样本（Few-shot）提示、思维链（CoT）等基本技巧；
群体智能概念：知道蚁群算法（Ant Colony Optimization）、遗传算法（Genetic Algorithm）、粒子群优化（Particle Swarm Optimization）的核心思想（分布式、自组织、协同）；
Python基础：能读懂简单的Python代码，会使用openai/anthropic库调用LLM API。

2. 环境/工具

编程语言：Python 3.8+（推荐3.10）；
LLM API：OpenAI API（需申请API密钥）或Anthropic Claude API；
开发环境：Jupyter Notebook（用于实验）；
依赖库：openai（调用OpenAI API）、numpy（数值计算）、matplotlib（结果可视化）。

安装依赖：

pip install openai numpy matplotlib

核心内容：群体智能在提示优化中的实战

步骤一：理解群体智能与提示优化的“适配性”

1. 群体智能的核心思想

群体智能（Swarm Intelligence, SI）是一种从生物群体行为中抽象出来的智能模式，核心特点是：

分布式：没有中央控制，每个个体（如蚂蚁、蜜蜂）独立决策；
自组织：通过个体间的简单交互（如信息素传递、位置调整），形成全局有序的行为；
协同性：个体通过合作完成复杂任务（如蚁群找最短路径、蜂群筑巢）。

2. 提示优化的需求与群体智能的对应

提示优化的核心需求是在庞大的提示空间中高效找到最优解，而群体智能的优势正好匹配这一需求：

多维度优化：群体智能算法能同时优化提示的多个维度（如少样本示例、思维链步骤、语气风格）；
自适应：能根据用户反馈（如生成结果的准确率、用户评分）动态调整提示；
高效搜索：通过群体协同，避免陷入局部最优（如手动优化时的“试错陷阱”）。

3. 常见结合场景

少样本提示优化：用遗传算法生成最优的少样本示例组合；
对话流程优化：用蚁群算法找到最优的对话提示序列；
动态参数调整：用粒子群优化实时调整提示的温度（Temperature）、top-k等参数。

步骤二：用遗传算法优化少样本提示（实战）

少样本提示（Few-shot Prompting）是提示工程中常用的技巧，通过给LLM提供几个示例，引导其生成更准确的结果。但示例的选择直接影响提示效果，手动选择示例不仅效率低，还容易遗漏最优组合。

遗传算法（Genetic Algorithm, GA）是一种模拟生物进化的群体智能算法，通过“选择-交叉-变异”的迭代过程，从种群中筛选出最优个体。我们可以用遗传算法自动生成最优的少样本示例组合。

1. 问题定义

假设我们要解决一个文本分类任务：将用户的评论分为“正面”、“负面”、“中性”三类。我们需要优化少样本提示中的示例，让LLM的分类准确率最高。

2. 遗传算法的“提示映射”

将遗传算法的核心概念与提示优化对应：

个体（Individual）：一个少样本提示（包含3个示例）；
基因（Gene）：每个示例的文本（如“评论内容+分类标签”）；
种群（Population）：一组少样本提示（如10个个体）；
适应度（Fitness）：LLM用该提示分类的准确率（越高越好）；
选择（Selection）：保留适应度高的个体（如前50%）；
交叉（Crossover）：交换两个个体的部分基因（如交换第2个示例）；
变异（Mutation）：随机修改一个个体的基因（如替换一个示例的标签）。

3. 具体实现步骤

（1）定义“基因”表示

每个个体（少样本提示）由3个示例组成，每个示例是“评论+标签”的组合。例如：

# 一个个体（少样本提示）
individual = [
    {"comment": "这家店的饭菜很可口，服务也很好！", "label": "正面"},
    {"comment": "今天下雨了，心情有点差。", "label": "负面"},
    {"comment": "这部电影一般般，没有特别的亮点。", "label": "中性"}
]

（2）初始化种群

随机生成10个个体（种群大小为10），每个个体包含3个随机选择的示例（从预先准备的示例库中选取）。

示例库（预先收集的评论示例）：

example_pool = [
    {"comment": "这家店的饭菜很可口，服务也很好！", "label": "正面"},
    {"comment": "今天下雨了，心情有点差。", "label": "负面"},
    {"comment": "这部电影一般般，没有特别的亮点。", "label": "中性"},
    {"comment": "快递员态度很差，还迟到了。", "label": "负面"},
    {"comment": "这本书很有深度，值得一读。", "label": "正面"},
    {"comment": "天气不冷不热，适合出门散步。", "label": "中性"}
]

初始化种群：

import random

def create_individual(example_pool, num_examples=3):
    """生成一个个体（随机选3个示例）"""
    return random.sample(example_pool, num_examples)

def create_population(example_pool, population_size=10, num_examples=3):
    """生成种群"""
    return [create_individual(example_pool, num_examples) for _ in range(population_size)]

# 初始化种群（10个个体）
population = create_population(example_pool, population_size=10)

（3）计算适应度（评估个体性能）

对于每个个体（少样本提示），我们需要计算其适应度——LLM用该提示分类的准确率。

首先，构造提示模板：

def build_prompt(individual, query):
    """将个体转换为少样本提示"""
    prompt = "请将以下评论分为正面、负面、中性三类。示例：\n"
    # 添加少样本示例
    for idx, example in enumerate(individual):
        prompt += f"{idx+1}. 评论：{example['comment']}\n   分类：{example['label']}\n"
    # 添加待分类的查询
    prompt += f"\n请分类：{query}"
    return prompt

然后，调用OpenAI API生成结果，并计算准确率：

import openai
from typing import List

# 设置OpenAI API密钥（请替换为你的密钥）
openai.api_key = "your-api-key"

def evaluate_fitness(individual: List[dict], test_queries: List[dict]) -> float:
    """
    评估个体的适应度（分类准确率）
    :param individual: 少样本提示（个体）
    :param test_queries: 测试集（[{"comment": "...", "label": "..."}]）
    :return: 准确率（0-1）
    """
    correct = 0
    total = len(test_queries)
    
    for query in test_queries:
        # 构造提示
        prompt = build_prompt(individual, query["comment"])
        # 调用OpenAI API（使用gpt-3.5-turbo）
        response = openai.ChatCompletion.create(
            model="gpt-3.5-turbo",
            messages=[{"role": "user", "content": prompt}],
            temperature=0.0  # 降低随机性，让结果更稳定
        )
        # 提取生成的分类结果
        predicted_label = response.choices[0].message.content.strip()
        # 计算正确数
        if predicted_label == query["label"]:
            correct += 1
    
    # 返回准确率
    return correct / total if total > 0 else 0.0

假设我们有一个测试集（10条评论）：

test_queries = [
    {"comment": "这家餐厅的环境很优雅，菜品也很精致。", "label": "正面"},
    {"comment": "我等了半个小时，还没拿到我的咖啡。", "label": "负面"},
    {"comment": "这部电视剧的剧情一般，但演员演技不错。", "label": "中性"},
    # 更多测试用例...
]

（4）选择（保留优秀个体）

选择适应度高的个体，保留到下一代。这里用“轮盘赌选择”（Roulette Wheel Selection），适应度越高的个体，被选中的概率越大。

import numpy as np

def select_population(population: List[List[dict]], fitness_scores: List[float], selection_rate: float = 0.5) -> List[List[dict]]:
    """
    选择种群中的优秀个体
    :param population: 当前种群
    :param fitness_scores: 每个个体的适应度得分
    :param selection_rate: 保留比例（如0.5表示保留前50%）
    :return: 选中的个体列表
    """
    # 计算每个个体的选择概率（适应度归一化）
    total_fitness = sum(fitness_scores)
    if total_fitness == 0:
        # 所有个体适应度为0，随机选择
        probabilities = [1/len(population)] * len(population)
    else:
        probabilities = [score / total_fitness for score in fitness_scores]
    
    # 选择个体（保留前selection_rate比例）
    num_selected = int(len(population) * selection_rate)
    selected_indices = np.random.choice(len(population), size=num_selected, p=probabilities, replace=False)
    selected_population = [population[idx] for idx in selected_indices]
    
    return selected_population

（5）交叉（组合优秀基因）

将两个个体的部分基因交换，生成新的个体。例如，交换两个个体的第2个示例：

def crossover(parent1: List[dict], parent2: List[dict], crossover_rate: float = 0.8) -> List[dict]:
    """
    交叉两个父个体，生成子个体
    :param parent1: 父个体1
    :param parent2: 父个体2
    :param crossover_rate: 交叉概率（如0.8表示有80%的概率交叉）
    :return: 子个体
    """
    if random.random() > crossover_rate:
        # 不交叉，直接返回父个体1
        return parent1.copy()
    
    # 选择交叉点（如交换第2个示例）
    crossover_point = random.randint(1, len(parent1)-1)
    # 交叉生成子个体
    child = parent1[:crossover_point] + parent2[crossover_point:]
    return child

（6）变异（引入新基因）

随机修改个体的部分基因，避免种群陷入局部最优。例如，随机替换一个示例：

def mutate(individual: List[dict], example_pool: List[dict], mutation_rate: float = 0.1) -> List[dict]:
    """
    变异个体的基因
    :param individual: 待变异的个体
    :param example_pool: 示例库（用于替换基因）
    :param mutation_rate: 变异概率（如0.1表示每个基因有10%的概率变异）
    :return: 变异后的个体
    """
    mutated_individual = individual.copy()
    for i in range(len(mutated_individual)):
        if random.random() < mutation_rate:
            # 随机替换一个示例（从示例库中选）
            mutated_individual[i] = random.choice(example_pool)
    return mutated_individual

（7）迭代进化

将上述步骤循环执行，直到种群的适应度不再提升（收敛）。例如，迭代10代：

def genetic_algorithm(example_pool: List[dict], test_queries: List[dict], population_size: int = 10, generations: int = 10, crossover_rate: float = 0.8, mutation_rate: float = 0.1) -> List[dict]:
    """
    遗传算法优化少样本提示
    :param example_pool: 示例库
    :param test_queries: 测试集
    :param population_size: 种群大小
    :param generations: 迭代代数
    :param crossover_rate: 交叉概率
    :param mutation_rate: 变异概率
    :return: 最优个体（最优少样本提示）
    """
    # 初始化种群
    population = create_population(example_pool, population_size)
    best_fitness = 0.0
    best_individual = None
    
    # 迭代进化
    for gen in range(generations):
        print(f"Generation {gen+1}/{generations}")
        
        # 1. 计算适应度
        fitness_scores = [evaluate_fitness(ind, test_queries) for ind in population]
        
        # 2. 记录最优个体
        current_best_fitness = max(fitness_scores)
        current_best_individual = population[fitness_scores.index(current_best_fitness)]
        if current_best_fitness > best_fitness:
            best_fitness = current_best_fitness
            best_individual = current_best_individual
        print(f"Current best fitness: {current_best_fitness:.2f}")
        
        # 3. 选择
        selected_population = select_population(population, fitness_scores)
        
        # 4. 交叉（生成新个体，补充种群大小）
        new_population = []
        while len(new_population) < population_size:
            # 随机选择两个父个体
            parent1 = random.choice(selected_population)
            parent2 = random.choice(selected_population)
            # 交叉生成子个体
            child = crossover(parent1, parent2, crossover_rate)
            new_population.append(child)
        
        # 5. 变异
        population = [mutate(ind, example_pool, mutation_rate) for ind in new_population]
    
    print(f"\nEvolution finished! Best fitness: {best_fitness:.2f}")
    return best_individual

4. 运行结果与分析

假设我们用10个个体，迭代10代，测试集准确率从初始的60%提升到了85%。最优个体（少样本提示）可能包含以下示例：

best_individual = [
    {"comment": "这家店的饭菜很可口，服务也很好！", "label": "正面"},
    {"comment": "快递员态度很差，还迟到了。", "label": "负面"},
    {"comment": "这部电影一般般，没有特别的亮点。", "label": "中性"}
]

结论：遗传算法通过“选择-交叉-变异”的迭代，自动找到了最优的少样本示例组合，比手动选择的示例更能覆盖测试集的场景。

步骤三：用蚁群算法优化对话提示（实战）

对话场景是提示工程中的难点，因为用户的问题具有多样性和动态性，单一的对话提示难以应对所有情况。蚁群算法（Ant Colony Optimization, ACO）是一种模拟蚂蚁寻找最短路径的群体智能算法，我们可以用它优化对话提示的流程，让对话更自然、更符合用户需求。

1. 问题定义

假设我们要设计一个客服对话系统，需要优化对话提示的流程（如“问候→问题识别→解决方案→结束语”），让用户的满意度最高。

2. 蚁群算法的“对话映射”

将蚁群算法的核心概念与对话优化对应：

蚂蚁（Ant）：一个对话流程（如“问候→问题识别→解决方案→结束语”）；
路径（Path）：对话中的每个步骤（如“问候”步骤的提示）；
信息素（Pheromone）：每个步骤提示的“优劣程度”（信息素越多，说明该提示越受用户欢迎）；
启发式信息（Heuristic）：每个步骤提示的“相关性”（如“问题识别”步骤的提示与用户问题的匹配度）。

3. 具体实现步骤

（1）定义“路径”与“信息素”

每个对话步骤有多个可选提示，例如：

问候步骤：[“您好！请问有什么可以帮您的？”, “欢迎来到我们的客服系统，请问您需要解决什么问题？”]；
问题识别步骤：[“您的问题是关于订单查询的吗？”, “请问您的问题属于产品售后还是物流问题？”]；
解决方案步骤：[“根据您的问题，建议您查看订单详情页的物流信息。”, “您可以拨打我们的售后电话：400-xxx-xxxx，获取更详细的帮助。”]；
结束语步骤：[“感谢您的咨询，祝您生活愉快！”, “如果您还有其他问题，请随时联系我们。”]。

我们为每个步骤的每个提示初始化信息素（初始值为1.0）：

# 对话步骤的可选提示
dialog_steps = {
    "greeting": ["您好！请问有什么可以帮您的？", "欢迎来到我们的客服系统，请问您需要解决什么问题？"],
    "problem_identification": ["您的问题是关于订单查询的吗？", "请问您的问题属于产品售后还是物流问题？"],
    "solution": ["根据您的问题，建议您查看订单详情页的物流信息。", "您可以拨打我们的售后电话：400-xxx-xxxx，获取更详细的帮助。"],
    "farewell": ["感谢您的咨询，祝您生活愉快！", "如果您还有其他问题，请随时联系我们。"]
}

# 初始化信息素（每个步骤的每个提示的信息素值）
pheromone = {
    step: [1.0 for _ in prompts] for step, prompts in dialog_steps.items()
}

（2）蚂蚁的“路径选择”

每个蚂蚁（对话流程）根据信息素和启发式信息，选择每个步骤的提示。例如，在“问候”步骤，蚂蚁选择提示的概率为：
[ P_{ij} = \frac{\tau_{ij}^\alpha \times \eta_{ij}^{\beta}{\sum_{k=1}}n \tau_{ik}^\alpha \times \eta_{ik}^\beta} ]
其中：

( \tau_{ij} )：第( i )个步骤的第( j )个提示的信息素；
( \eta_{ij} )：第( i )个步骤的第( j )个提示的启发式信息（如用户满意度）；
( \alpha )：信息素的权重（如2）；
( \beta )：启发式信息的权重（如1）。

（3）具体实现代码

（1）定义对话步骤与初始信息素

# 对话步骤的可选提示（每个步骤有2个选项）
dialog_steps = {
    "greeting": [
        "您好！请问有什么可以帮您的？",
        "欢迎来到我们的客服系统，请问您需要解决什么问题？"
    ],
    "problem_identification": [
        "您的问题是关于订单查询的吗？",
        "请问您的问题属于产品售后还是物流问题？"
    ],
    "solution": [
        "根据您的问题，建议您查看订单详情页的物流信息。",
        "您可以拨打我们的售后电话：400-xxx-xxxx，获取更详细的帮助。"
    ],
    "farewell": [
        "感谢您的咨询，祝您生活愉快！",
        "如果您还有其他问题，请随时联系我们。"
    ]
}

# 初始化信息素（每个步骤的每个提示的信息素值为1.0）
pheromone = {
    step: [1.0 for _ in prompts] for step, prompts in dialog_steps.items()
}

# 启发式信息（每个步骤的每个提示的用户满意度，假设初始值为0.5）
heuristic = {
    step: [0.5 for _ in prompts] for step, prompts in dialog_steps.items()
}

（2）定义蚂蚁的“路径选择”函数

def select_prompt(step: str, alpha: float = 2.0, beta: float = 1.0) -> int:
    """
    蚂蚁选择当前步骤的提示（基于信息素和启发式信息）
    :param step: 对话步骤（如"greeting"）
    :param alpha: 信息素的权重
    :param beta: 启发式信息的权重
    :return: 选择的提示索引（如0或1）
    """
    # 获取当前步骤的信息素和启发式信息
    tau = pheromone[step]
    eta = heuristic[step]
    
    # 计算每个提示的选择概率
    probabilities = []
    total = 0.0
    for t, e in zip(tau, eta):
        prob = (t ** alpha) * (e ** beta)
        probabilities.append(prob)
        total += prob
    
    # 归一化概率（避免总和为0）
    if total == 0:
        probabilities = [1/len(probabilities)] * len(probabilities)
    else:
        probabilities = [p / total for p in probabilities]
    
    # 选择提示索引（根据概率）
    return random.choices(range(len(probabilities)), weights=probabilities, k=1)[0]

（3）定义蚂蚁的“路径生成”函数

每个蚂蚁生成一个对话流程（路径）：

def generate_path(alpha: float = 2.0, beta: float = 1.0) -> List[tuple]:
    """
    蚂蚁生成对话流程（路径）
    :param alpha: 信息素的权重
    :param beta: 启发式信息的权重
    :return: 对话流程（步骤+提示索引，如[("greeting", 0), ("problem_identification", 1), ...]）
    """
    path = []
    for step in dialog_steps.keys():
        # 选择当前步骤的提示索引
        prompt_idx = select_prompt(step, alpha, beta)
        path.append((step, prompt_idx))
    return path

（4）定义“信息素更新”函数

蚂蚁完成对话后，根据用户的满意度更新信息素：

def update_pheromone(paths: List[List[tuple]],满意度: List[float], rho: float = 0.5) -> None:
    """
    更新信息素（模拟蚂蚁留下信息素）
    :param paths: 所有蚂蚁的对话流程
    :param 满意度: 每个蚂蚁对话流程的用户满意度（0-1）
    :param rho: 信息素蒸发率（0-1，越大蒸发越快）
    """
    # 信息素蒸发（所有步骤的信息素乘以(1-rho)）
    for step in pheromone.keys():
        pheromone[step] = [t * (1 - rho) for t in pheromone[step]]
    
    # 蚂蚁留下信息素（满意度越高，留下的信息素越多）
    for path, score in zip(paths, 满意度):
        for step, prompt_idx in path:
            # 增加信息素（score越大，增加越多）
            pheromone[step][prompt_idx] += score

（5）迭代优化

模拟多个蚂蚁（如10只）生成对话流程，收集用户满意度，更新信息素，迭代10次：

def ant_colony_optimization(num_ants: int = 10, generations: int = 10, alpha: float = 2.0, beta: float = 1.0, rho: float = 0.5) -> List[tuple]:
    """
    蚁群算法优化对话提示流程
    :param num_ants: 蚂蚁数量
    :param generations: 迭代代数
    :param alpha: 信息素的权重
    :param beta: 启发式信息的权重
    :param rho: 信息素蒸发率
    :return: 最优对话流程（步骤+提示索引）
    """
    best_path = None
    best_score = 0.0
    
    for gen in range(generations):
        print(f"Generation {gen+1}/{generations}")
        
        # 1. 所有蚂蚁生成对话流程
        paths = [generate_path(alpha, beta) for _ in range(num_ants)]
        
        # 2. 模拟用户满意度（假设用LLM评估对话流程的效果）
        # 这里用随机数模拟（实际应用中需要收集真实用户反馈）
        满意度 = [random.uniform(0.0, 1.0) for _ in range(num_ants)]
        
        # 3. 记录最优对话流程
        current_best_score = max(满意度)
        current_best_path = paths[满意度.index(current_best_score)]
        if current_best_score > best_score:
            best_score = current_best_score
            best_path = current_best_path
        print(f"Current best score: {current_best_score:.2f}")
        
        # 4. 更新信息素
        update_pheromone(paths, 满意度, rho)
    
    print(f"\nOptimization finished! Best score: {best_score:.2f}")
    return best_path

4. 运行结果与分析

假设我们用10只蚂蚁，迭代10次，最优对话流程的用户满意度从初始的0.6提升到了0.9。最优对话流程可能是：

best_path = [
    ("greeting", 1),  # 提示："欢迎来到我们的客服系统，请问您需要解决什么问题？"
    ("problem_identification", 0),  # 提示："您的问题是关于订单查询的吗？"
    ("solution", 1),  # 提示："您可以拨打我们的售后电话：400-xxx-xxxx，获取更详细的帮助。"
    ("farewell", 0)  # 提示："感谢您的咨询，祝您生活愉快！"
]

结论：蚁群算法通过“信息素传递”，让对话提示的流程不断优化，更符合用户的需求。

步骤四：动态自适应提示优化（进阶）

前面的例子都是离线优化（在固定的测试集上优化），但实际应用中，用户的需求是动态变化的（如不同时间段的用户问题不同），我们需要实时优化提示。

粒子群优化（Particle Swarm Optimization, PSO）是一种模拟鸟群觅食的群体智能算法，我们可以用它实时调整提示的参数（如温度、top-k），让提示适应动态的用户需求。

1. 问题定义

假设我们要调整提示的温度参数（Temperature，控制生成结果的随机性），让用户的满意度最高。温度越高，生成的结果越随机；温度越低，生成的结果越确定。

2. 粒子群优化的“参数映射”

将粒子群优化的核心概念与参数调整对应：

粒子（Particle）：一个温度参数（如0.5）；
位置（Position）：粒子的当前温度值；
速度（Velocity）：粒子的温度变化率；
适应度（Fitness）：用户对该温度参数生成结果的满意度（越高越好）；
个体最优（Personal Best）：粒子自己的最优温度值；
全局最优（Global Best）：所有粒子的最优温度值。

3. 具体实现步骤

这里我们用粒子群优化实时调整提示的温度参数：

（1）定义粒子类

class Particle:
    def __init__(self, min_temp: float = 0.0, max_temp: float = 1.0):
        """
        粒子类（代表一个温度参数）
        :param min_temp: 温度的最小值
        :param max_temp: 温度的最大值
        """
        # 初始化位置（温度值，随机在[min_temp, max_temp]之间）
        self.position = random.uniform(min_temp, max_temp)
        # 初始化速度（随机在[-0.1, 0.1]之间）
        self.velocity = random.uniform(-0.1, 0.1)
        # 初始化个体最优位置（当前位置）
        self.personal_best_position = self.position
        # 初始化个体最优适应度（-infinity，因为要找最大值）
        self.personal_best_fitness = -float("inf")

（2）定义适应度函数

计算用户对该温度参数生成结果的满意度（这里用随机数模拟，实际应用中需要收集用户反馈）：

def evaluate_particle_fitness(particle: Particle, prompt: str, user_query: str) -> float:
    """
    评估粒子的适应度（用户满意度）
    :param particle: 粒子（温度参数）
    :param prompt: 提示模板
    :param user_query: 用户的问题
    :return: 用户满意度（0-1）
    """
    # 构造提示（包含温度参数）
    full_prompt = f"{prompt}\n温度参数：{particle.position:.2f}\n用户问题：{user_query}"
    # 调用OpenAI API生成结果（这里用随机数模拟）
    # response = openai.ChatCompletion.create(...)
    # 假设生成结果的满意度是随机的（0-1）
    satisfaction = random.uniform(0.0, 1.0)
    return satisfaction

（3）定义粒子群优化函数

def particle_swarm_optimization(prompt: str, user_query: str, num_particles: int = 10, generations: int = 10, w: float = 0.5, c1: float = 1.5, c2: float = 1.5) -> float:
    """
    粒子群优化提示的温度参数
    :param prompt: 提示模板
    :param user_query: 用户的问题
    :param num_particles: 粒子数量
    :param generations: 迭代代数
    :param w: 惯性权重（控制速度的继承）
    :param c1: 个体学习因子（控制向个体最优位置的移动）
    :param c2: 全局学习因子（控制向全局最优位置的移动）
    :return: 最优温度参数
    """
    # 初始化粒子群
    swarm = [Particle() for _ in range(num_particles)]
    # 初始化全局最优位置（-infinity）
    global_best_position = -float("inf")
    # 初始化全局最优适应度（-infinity）
    global_best_fitness = -float("inf")
    
    # 迭代优化
    for gen in range(generations):
        print(f"Generation {gen+1}/{generations}")
        
        # 评估每个粒子的适应度
        for particle in swarm:
            # 计算适应度（用户满意度）
            fitness = evaluate_particle_fitness(particle, prompt, user_query)
            
            # 更新个体最优
            if fitness > particle.personal_best_fitness:
                particle.personal_best_fitness = fitness
                particle.personal_best_position = particle.position
            
            # 更新全局最优
            if fitness > global_best_fitness:
                global_best_fitness = fitness
                global_best_position = particle.position
        
        # 更新每个粒子的速度和位置
        for particle in swarm:
            # 计算新速度（惯性+个体学习+全局学习）
            new_velocity = (
                w * particle.velocity +
                c1 * random.random() * (particle.personal_best_position - particle.position) +
                c2 * random.random() * (global_best_position - particle.position)
            )
            # 限制速度范围（避免过大）
            new_velocity = max(min(new_velocity, 0.1), -0.1)
            # 更新速度
            particle.velocity = new_velocity
            # 更新位置
            new_position = particle.position + new_velocity
            # 限制位置范围（0-1）
            new_position = max(min(new_position, 1.0), 0.0)
            # 更新位置
            particle.position = new_position
        
        print(f"Current global best fitness: {global_best_fitness:.2f}")
        print(f"Current global best position (temperature): {global_best_position:.2f}")
    
    print(f"\nOptimization finished! Best temperature: {global_best_position:.2f}")
    return global_best_position