核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
当前位置: 首页 >
核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
更关键的是,收入结构发生了质变——受全球付费用户和 API 调用量大涨驱动,Kimi 的海外收入已历史性地超过了国内收入。 在经历了春节期间动辄数十亿的红包大战与算力狂飙后,可以预见的是,在即将到来的财报季中…...
宁王净赚722亿,曾毓群分红81亿!淘金果然不如卖水_宁德_时代_车企...
...
Summer Yue后来复盘时分析,这些海量的邮件可能引发了一种“上下文压缩”(Compaction)机制,也就是说,OpenClaw的上下文窗口(也就是“工作记忆”)被撑爆了,为了能有空间处理新信息,Ope…...
查看详情>>