【AIGC】Tool-Augmented LLMs
·

1、能够使用工具的 AI
何时搜寻是机器自己决定的,每次投骰子,同样的问题,可能会搜寻,也可能不搜寻
PS:“酸民”指的是在网络上表现出明显嫉妒、羡慕或负面情绪,并通过评论、吐槽或攻击他人来宣泄的人。
LLM 联网后,回答也可能是错的,李老师没有去过 google 工作
GPT 会用 bing 搜索,搜索到的结果返回 GPT,最后输出
流程和人类搜索一样,输入问题,点选网页,收藏(阅读)
人类老师教 LLM,哪些问题要搜索,完整搜索过程
原为中的 state 就是搜索结果
根据 state 去 action(文字接龙)
只选一个段落收藏,不是整篇文章
自己搜各种问题,最后输出答案
想办法在没有人类示范的情况下生产资料
虚线是 baseline
橙色是训练的时候引入了可以呼唤 API 的资料来训练,但是测试的时候不让其呼唤 API
蓝色是训练的时候可以呼唤 API 的资料训练,测试的时候允许调用 API
如果模型太小,它学不会用工具
2、参考
- https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php
- https://www.bilibili.com/video/BV18fXbY6Eis/?spm_id_from=333.1387.homepage.video_card.click&vd_source=8e91f8e604278558ec015e749d1a3719
- https://www.youtube.com/watch?v=ZID220t_MpI
3、总结
督导式学习参与其中,教模型学会如何提炼需要搜索的问题,把搜索问题的答案作为资讯,导入文字接龙范式中
更多推荐






























所有评论(0)