Yan 的杂物志_个人主页分享

Created2025-04-04|2_Note0_Technic0_工具大模型其它大模型

1 简介好消息是，2024 年 3 月 4 日发布了 Claude3，据传比 GPT-4 更好，snooet 版本可以免费试用，坏消息是我们这儿不能用。在官网注册时，需要选择国家并使用手机接收短信验证码。而在选项中没有中国这个选项。即使成功注册了账号并申请了 API 密钥，免费版本仍需要绑定信用卡才能使用。绑定信用卡也需要接收短信验证，网上说每个手机号只能注册一次，所以似乎也无法短信接收平台。（如果你找到了注册方法，请私信告诉我）虽然无法通过 API 调用并将其添加到我们的工具中，但可以通过亚马逊云来免费体验一下。 2 Claude3 2.1 三个模型 Claude 3 共发布了三个模型： Claude 3 Opus：最强大的模型，在高度复杂的任务上提供最先进的性能，并展示流畅性和类似人类的理解。 Claude 3 Sonnet：在智能和速度之间最平衡的模型，是企业工作负载和规模化 AI 部署的绝佳选择 Claude 3 Haiku：最快、最紧凑的模型，旨在实现近乎即时的响应能力和模仿人类交互的无缝 AI 体验 2.2 主要特点这次升级的主要特点包含：多语言功能：Cla ...

大型语言模型与Agent的结合探索

Created2025-04-04|2_Note0_Technic2_算法7_模型增强Agent

何需足量革，尽覆此大地，片革垫靴底，即同覆大地。 -- 寂天《入行论》最近看了一些 LLM 实测报告，感觉 LLM 的能力很强大，但在当前阶段，仍然只能对单一简单问题进行一次提问（详见：开源项目_大海捞针测试），对于复杂的问题，可以通过将其拆解为多个简单问题，使用 LLM 进行多步问答来解决。因此，引入了 Agent。目前也临着在对话过程中容易偏离主题的问题（详见：论文阅读_多Agent_股票操作示例）。猜想大模型的尽头并非某个全能的大模型，而是类似于人的存在，可能是面向 Agent 优化的大模型；或者整体系统由多个大模型组成，其中一个充当主控：这个主控模型并不大，所以反应速度快。他并不存储所有的知识，但包含：内在信念（详见：论文阅读_语言与决策_通过LENS看人类行为），基本的常识，语言理解能力，基础推理能力，类似于高中生的水平。他链接到一个外挂记忆系统，该系统存储客观知识和主观总结，以及长短期记忆，支持存储/搜索（详见：文章阅读_Agent记忆机制综述）。他还包含一个自我进化系统，该系统能记忆、总结，并推动自已更新能力库。和当前系统很大差别在于它能自主构建自己的 ...

Obsidian插件开发指南

Created2025-04-04|2_Note0_Technic0_工具笔记工具Obsidian开发

1 Obidian 开发 Obsidian 基于 Electron 框架开发（开发者可以使用 Web 技术构建桌面应用，Google 的 Flutter 也是类似的框架），主要使用 HTML、CSS 和 JavaScript。后端则依赖 Node.js（Node.js 是基于 Chrome V8 引擎的 JavaScript 运行环境），使 JavaScript 能在服务器端运行。开发 Obsidian 插件时，需要掌握 JavaScript 和 Node.js。比如，利用 Node.js 提供的模块和 API 进行文件操作、访问系统资源、处理网络请求等。 2 开发环境我的开发环境是：VSCode + Node Docker + Copilot。这样不仅不会影响我的宿主机环境，开发起来也很舒适，还可以利用辅助编码工具。如果想开发 Obsidian 插件，就需要安装 Node.js 环境。Node.js 提供了 JavaScript 的运行环境和许多内置模块；同时，安装 Node.js 也会安装 npm，用于管理插件项目的依赖项。推荐使用 Node.js 的第 18 版： 12$ ...

法律行业算法比赛解读

Created2025-04-04|2_Note0_Technic2_算法7_模型增强AgentAgent实战

1 比赛介绍第三届琶洲算法大赛 -GLM 法律行业大模型挑战赛道赛题页面：https://tianchi.aliyun.com/competition/entrance/532221/information 解题示例：https://tianchi.aliyun.com/competition/entrance/532221/customize444 说明文档：https://zhipu-ai.feishu.cn/wiki/M6lCwkSEWiBQIKkQLtIcTuV2nqh?spm=a2c22.12281976.0.0.536f7dd2Pg0INK 2 问题概述在法律服务领域，基于智谱 GLM-4 大模型和相关业务 API，构建一个能回答法律问题的 Agent（问题机器人）。该 Agent 需要在一小时内回答 200 道问题。这种整体方案可以应用于许多专业领域。我们也可以通过比较优化和未优化的情况下，看看效果如何。（初赛 A 榜的前 100 名得分都在 80-90 分区间内，查看了一些代码后，我觉得稍加改进也能达到 70+） 3 问题类型简单问题：查单表和几个字段。 ...

LLM 中的 role

Created2025-03-25|2_Note0_Technic0_工具GPT应用

1 取值 role 有 3 个取值： system: 设置 AI 助手的行为指南和身份定位 user: 用户输入的内容 assistant: AI 的回复内容 2 示例 123456messages = [ {"role": "system", "content": "你是AI助手"}, {"role": "user", "content": "你好"}, {"role": "assistant", "content": "你好，我能帮你什么?"}, {"role": "user", "content": "解释下Python"}] 3 说明 system 消息设定 AI 的行为规范和专 ...

论文阅读_Search-R1：大模型+搜索引擎

Created2025-03-21|2_Note0_Technic2_算法15_强化学习

1234567英文名称：Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning中文名称：Search-R1：训练大型语言模型进行推理并利用搜索引擎的强化学习链接: http://arxiv.org/pdf/2503.09516v2代码: https://github.com/PeterGriffinJin/Search-R1 (1.4K Star)作者: Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han机构: 伊利诺伊大学厄巴纳-香槟分校，马萨诸塞大学阿默斯特分校日期：2025-03-12 1 读后感由于大语言模型（LLM）的知识更新不够迅速，LLM 结合搜索的应用场景变得非常普遍。未来的发展趋势可能会是“小而美”的 LLM 与强大的 Agent、工具、搜索、RAG 等结合，而不是追求“大而全”的 LLM 来解决所有问题。这篇文章主要探讨大模型与搜索的结合策略：如何 ...

录视频有感_聊聊一种技不如人的羞愧感

Created2025-03-19|2_Note0_Technic0_工具发贴

1 录制实感今天想分享一些录视频过程的感受：一种技不如人的“羞愧感”。录几个视频介绍我开源工具的用法，这个任务已经列在我的周计划里，可能都有十周以上了，但一直没有录。一方面是因为界面一直在更改，一方面是我对录视频这件事非常抵触。别提把人录上了，哪怕只是录个声音，我都感到很有压力。可能是平时看视频的时候，给我推荐的都是一些顶尖 UP 主的视频，质量很高，我就觉得别人的水平都很高。录的时候会不自觉地预测别人的反馈，注意力没办法集中在内容上，就更加磕磕绊绊的；要么就是需要录很多次，或者花费大量精力来调整自己的注意力。每一次对自己录的效果都不满意，这种纠结和负面情绪对之后再做这件事来说，又是一个减分项。可能很多刚开始录视频的小伙伴都有这种感觉。这次更新之后，界面的操作确实有些复杂，还包含了很多细节，录视频确实是最直观的方法。只好咬牙又重新开始录制。但仍然有磕巴，停顿，口头语，声音忽大忽小的问题…… 忽然想起去年年底开发了一个视频编辑工具，当时因为忙其他事情，也没怎么用。这次才真正开始用上。 2 借助工具流程如下：使用视频会议录屏并导出 mp4 也可以用其他方法进行录屏 ...

TabPFN

Created2025-03-19|2_Note0_Technic2_算法4_机器学习

1 简介 TabPFN（Tabular Prior-Data Fitted Network）是由 Meta AI 团队开发的针对表格数据的神经网络分类器。 1.1 主要特点是无需超参数调优：TabPFN 与 XGBoost、LightGBM 等传统树模型不同，它即插即用，不需调整超参数。极快的推理速度：TabPFN 训练和预测时间不到一秒，远超深度学习模型。基于 Transformer：尽管规模小，它在预训练时利用大量合成数据，实现对新数据集的良好泛化能力。适合小型数据集（<10K 样本）：TabPFN 在小数据集上表现出色，但对大规模数据暂不是最佳。 1.2 适用场景对于小型表格数据集，希望能够快速获得高质量的分类结果。不希望投入太多时间在参数调优上，需要一个即插即用的分类器。 2 原理 TabPFN 通过元学习（Meta-Learning）预训练一个 Transformer，让其学习各种合成数据的模式，从而可以在新数据集上实现零训练和极速推理。对于小型表格数据分类任务，它是一个开箱即用且无需调参的强力工具。 3 阶段预训练阶段（Offline Lear ...

doocs-md

Created2025-03-18|2_Note0_Technic0_工具笔记工具markdown

doocs-md 是一个开源的公众号 Markdown 编辑器，能实时将 md 语法渲染成公众号图文，其亮点在于：提供多种 CSS 风格。目前在 Github 上有 6.9K star 主要语言：Vue3, TypeScript，JavaScript 在线使用：https://doocs.github.io/md/ 项目地址：https://github.com/doocs/md 用法：将 md 文档导入编辑器，选择合适的公众号风格和格式，如果有图片且为本地图，默认需手动依次上传复制 ->内容粘贴到公众号后台。 doocs-md 的发布功能需要配合浏览器插件“微信公众号同步助手”使用，可将文章发布到多个平台。支持本地图片转换成线上图片。问题：不如 ob 插件上传图片那么方便优点：可传多个平台标题，margin，字体大小都很合适，有一些可选格式

Obsidian文章发布到公众号时的排版方法

Created2025-03-18|2_Note0_Technic0_工具笔记工具Obsidian插件

1 引言我们常常使用 obsidian 写文章，发布到公众号和其他公共平台，其中有两个比较麻烦的问题：一个是将 markdown 转换成合适的网页格式，另一个是上传图片。这往往会花费很多时间，尤其是当文章较长，包含各层标题、引用、代码和公式时，需要花费更多的时间。此外，由于公众号文章需要有封面图，文章中也需要一些插图，因此就需要将图从 ob 中复制出来，再上传到公众号平台。所以一直在找一键发布的方案。找到几个工具可以简化上述操作，但也都有各自问题。比如：使用壹伴工具进行公众号排版，其中预设了很多风格排版，还可以以插件方式在公众号网页中使用；但是它是收费的，且将 markdown 转为 HTML，以及处理图片的问题仍不可避免。使用开源工具 doocs-md 直接将 markdown 转成公众号格式的 HTML 也不错。它支持直接输入 markdown 格式，但也无法解决图片上传的问题，且风格相对有限。安装 Obsidian 插件 obsidian-wechat-public-platform，它可以自动上传图片，将 markdown 转换为 HTML，并保存到公众号草稿箱；但 ...