大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 71 天前的主题，其中的信息可能已经有所发展或是发生改变。

作为一个喜欢收集影视资源的人，笔者面临的一个任务是：从文件名中解析出格式化的媒体信息（信息源统一为The Movie Database (TMDB)），方便整理文件，如：

文件名	格式化信息
Young.Woman.and.the.Sea.2024.2160p.DSNP.WEB-DL.H265.HDR.DDP5.1.Atmos-ADWeb.mkv	`{'title': '泳者之心', 'genre': 'movie', 'year': 2024}`
[動畫瘋] 物語系列第外季＆第怪季[9][1080P].mp4	`{'title': '物语系列', 'genre': 'tv(anime)', 'year': 2009, 'tv_season_num': 5, 'tv_episode': 9}`

那么，在给定文件名的情况下，怎么用大语言模型（ LLM ，以下简称大模型） + TMDB API 来完成媒体信息的解析工作呢？这篇文章应运而生。

当然，解析媒体信息 + 整理媒体文件（或者说媒体文件刮削），已经有很多现成的解决方案，如nas-tools、jellyfin，笔者更多是想探索大模型的可能性。

"太长不看"的总结：

qwen-plus-latest (qwen 2.5) 强于 deepseek-chat (v2.5)，gpt-4o-mini/gemini-1.5-flash 落后
Tools(Function Calling)在机器间交互不好用，笔者的 JSON 调用模式效率&效果更优。

原文链接：大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例 - OrangeWolf 的博客

4 条回复 • 2024-09-21 15:09:25 +08:00

1

anonydmer

71 天前

看了原文，挺好的，楼主可以再加个 kimi 的测试一下，它有一个原生 JSON Mode 的功能

2

TimePPT

71 天前 via Android

实体抽取输出 json 现在 gpt4o 有 json schema 模式

3

neteroster

71 天前 via Android

4o mini 也可以传 json schema

4

marquina

OP

70 天前

@anonydmer #1
@TimePPT #2
@neteroster #3
其实文章围绕的点是“如何更好地让大模型调用外部函数”，是否用 json mode 区别不大😂

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 2594 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 20ms · UTC 06:27 · PVG 14:27 · LAX 22:27 · JFK 01:27
Developed with CodeLauncher
♥ Do have faith in what you're doing.