cssxsh 发布的帖子
-
RE: NLPHelper - 自然语言处理模型训练数据采集专用插件
@damemod
还没开发完成,不过只要安装有 Mirai Hibernate Plugin 就会收集数据,mirai-hibernate-nlp 只是导出的功能 -
Mirai Hibernate NLP,用于将聊天记录导出为 NLP 所需数据的插件
Mirai Hibernate NLP
Mirai Hibernate Plugin 的 NLP 扩展,用于导出 NLP 所用聊天数据
相关项目:
Mirai Hibernate Plugin 前置插件,用于 Hibernate ORM 框架的初始化Command
nlp-export
/nlp-export original <group> <date>
导出 原始数据
举例:/nlp-export original 123456 2022-09-12
先占个坑 gpt2 之类的数据格式以后再添加
隔壁插件 https://mirai.mamoe.net/topic/1596 的竞品
应该有不少人用过我的 mirai-hibernate-plugin (大概)
这个插件自带消息记录器,如果需要 NLP数据可以随时从数据库导出,这个插件用于格式化输出 -
RE: NLPHelper - 自然语言处理模型训练数据采集专用插件
@Mitr-yuzr
我那个是前置插件
可以另外写个依赖它的mirai-hibernate-nlp
去过滤和输出 -
RE: NLPHelper - 自然语言处理模型训练数据采集专用插件
@Mitr-yuzr
导出 json 的基本格式是啥
我之前写过前置插件
https://github.com/cssxsh/mirai-hibernate-plugin这个内置有消息记录器
随便写写就能加上新功能导出你想要的 nlp 数据 -
RE: NLPHelper - 自然语言处理模型训练数据采集专用插件
@Mitr-yuzr
也许可以过滤掉 机器人发言时间 临近的发言
虽然有误伤,但会好一些那你这个不能和其他插件一起用描述就有点问题
应该是 为了避免其他插件的功能引发的对话文本 污染样本池,请避免在同一个群里同时使用本插件和其他插件 -
RE: NLPHelper - 自然语言处理模型训练数据采集专用插件
@Mitr-yuzr
看了一下你的项目
打包没必要用 shadowmirai-console 有自己的打包方式
mirai:buildPlugin
另外也没必要用 jackson ,
mirai-console 本身有 kotlinx.serialization-json 作为 json 序列化支持 -
RE: 在Linux上运行时找不到Bot实例
build.gradle.kts 里 第三四 行左右
id("net.mamoe.mirai-console") version "xxxx"
xxx 就是 mirai console gradle 插件版本,和 mirai 版本是 同步的
你可以改成 2.12.2,最新稳定版 -
RE: 运行报错闪退
其他版本都挺正常的,是
v2.12.1
, 为啥就 mirai-console 是诡异的v2.1.0
你可以用mcl -u
升级一下,或者手动改config.json
-
RE: 在Linux上运行时找不到Bot实例
在正常的启动流程里 插件
onEnable
阶段时,自动登录还没有触发,是拿不到 bot 实例的如果你用的是旧版的测试启动方式 runTerminal,你测试时 自动登录已经触发,这和真实环境是不同的
runTerminal 已经废弃,请升级 mirai gradle 插件版本,使用新版 的 task 测试 runConsole