Claude3模型试用指南
1 简介
好消息是,2024 年 3 月 4 日发布了 Claude3,据传比 GPT-4 更好,snooet
版本可以免费试用,坏消息是我们这儿不能用。
在官网注册时,需要选择国家并使用手机接收短信验证码。而在选项中没有中国这个选项。即使成功注册了账号并申请了
API
密钥,免费版本仍需要绑定信用卡才能使用。绑定信用卡也需要接收短信验证,网上说每个手机号只能注册一次,所以似乎也无法短信接收平台。(如果你找到了注册方法,请私信告诉我)
虽然无法通过 API
调用并将其添加到我们的工具中,但可以通过亚马逊云来免费体验一下。
2 Claude3
2.1 三个模型
Claude 3 共发布了三个模型:
Claude 3
Opus:最强大的模型,在高度复杂的任务上提供最先进的性能,并展示流畅性和类似人类的理解。
Claude 3
Sonnet:在智能和速度之间最平衡的模型,是企业工作负载和规模化 AI
部署的绝佳选择
Claude 3
Haiku:最快、最紧凑的模型,旨在实现近乎即时的响应能力和模仿人类交互的无缝
AI 体验
2.2 主要特点
这次升级的主要特点包含:
多语言功能:Cla ...
大型语言模型与Agent的结合探索
何需足量革,尽覆此大地,片革垫靴底,即同覆大地。 --
寂天《入行论》
最近看了一些 LLM 实测报告,感觉 LLM
的能力很强大,但在当前阶段,仍然只能对单一简单问题进行一次提问(详见:开源项目_大海捞针测试),对于复杂的问题,可以通过将其拆解为多个简单问题,使用
LLM 进行多步问答来解决。因此,引入了
Agent。目前也临着在对话过程中容易偏离主题的问题(详见:论文阅读_多Agent_股票操作示例)。
猜想大模型的尽头并非某个全能的大模型,而是类似于人的存在,可能是面向
Agent 优化的大模型;或者整体系统由多个大模型组成,其中一个充当主控:
这个主控模型并不大,所以反应速度快。
他并不存储所有的知识,但包含:内在信念(详见:论文阅读_语言与决策_通过LENS看人类行为),基本的常识,语言理解能力,基础推理能力,类似于高中生的水平。
他链接到一个外挂记忆系统,该系统存储客观知识和主观总结,以及长短期记忆,支持存储/搜索(详见:文章阅读_Agent记忆机制综述)。
他还包含一个自我进化系统,该系统能记忆、总结,并推动自已更新能力库。
和当前系统很大差别在于它能自主构建自己的 ...
Obsidian插件开发指南
1 Obidian 开发
Obsidian 基于 Electron 框架开发(开发者可以使用 Web
技术构建桌面应用,Google 的 Flutter 也是类似的框架),主要使用 HTML、CSS
和 JavaScript。后端则依赖 Node.js(Node.js 是基于 Chrome V8 引擎的
JavaScript 运行环境),使 JavaScript 能在服务器端运行。
开发 Obsidian 插件时,需要掌握 JavaScript 和 Node.js。比如,利用
Node.js 提供的模块和 API
进行文件操作、访问系统资源、处理网络请求等。
2 开发环境
我的开发环境是:VSCode + Node Docker +
Copilot。这样不仅不会影响我的宿主机环境,开发起来也很舒适,还可以利用辅助编码工具。
如果想开发 Obsidian 插件,就需要安装 Node.js 环境。Node.js 提供了
JavaScript 的运行环境和许多内置模块;同时,安装 Node.js 也会安装
npm,用于管理插件项目的依赖项。
推荐使用 Node.js 的第 18 版:
12$ ...
法律行业算法比赛解读
1 比赛介绍
第三届琶洲算法大赛 -GLM 法律行业大模型挑战赛道
赛题页面:https://tianchi.aliyun.com/competition/entrance/532221/information
解题示例:https://tianchi.aliyun.com/competition/entrance/532221/customize444
说明文档:https://zhipu-ai.feishu.cn/wiki/M6lCwkSEWiBQIKkQLtIcTuV2nqh?spm=a2c22.12281976.0.0.536f7dd2Pg0INK
2 问题概述
在法律服务领域,基于智谱 GLM-4 大模型和相关业务
API,构建一个能回答法律问题的 Agent(问题机器人)。该 Agent
需要在一小时内回答 200 道问题。
这种整体方案可以应用于许多专业领域。我们也可以通过比较优化和未优化的情况下,看看效果如何。(初赛
A 榜的前 100 名得分都在 80-90
分区间内,查看了一些代码后,我觉得稍加改进也能达到 70+)
3 问题类型
简单问题:查单表和几个字段。 ...
LLM 中的 role
1 取值
role 有 3 个取值:
system: 设置 AI 助手的行为指南和身份定位
user: 用户输入的内容
assistant: AI 的回复内容
2 示例
123456messages = [ {"role": "system", "content": "你是AI助手"}, {"role": "user", "content": "你好"}, {"role": "assistant", "content": "你好,我能帮你什么?"}, {"role": "user", "content": "解释下Python"}]
3 说明
system 消息设定 AI 的行为规范和专 ...
论文阅读_Search-R1:大模型+搜索引擎
1234567英文名称:Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning中文名称:Search-R1:训练大型语言模型进行推理并利用搜索引擎的强化学习链接: http://arxiv.org/pdf/2503.09516v2代码: https://github.com/PeterGriffinJin/Search-R1 (1.4K Star)作者: Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han机构: 伊利诺伊大学厄巴纳-香槟分校,马萨诸塞大学阿默斯特分校日期:2025-03-12
1 读后感
由于大语言模型(LLM)的知识更新不够迅速,LLM
结合搜索的应用场景变得非常普遍。未来的发展趋势可能会是“小而美”的 LLM
与强大的 Agent、工具、搜索、RAG 等结合,而不是追求“大而全”的 LLM
来解决所有问题。
这篇文章主要探讨大模型与搜索的结合策略:如何 ...
录视频有感_聊聊一种技不如人的羞愧感
1 录制实感
今天想分享一些录视频过程的感受:一种技不如人的“羞愧感”。
录几个视频介绍我开源工具的用法,这个任务已经列在我的周计划里,可能都有十周以上了,但一直没有录。一方面是因为界面一直在更改,一方面是我对录视频这件事非常抵触。别提把人录上了,哪怕只是录个声音,我都感到很有压力。
可能是平时看视频的时候,给我推荐的都是一些顶尖 UP
主的视频,质量很高,我就觉得别人的水平都很高。录的时候会不自觉地预测别人的反馈,注意力没办法集中在内容上,就更加磕磕绊绊的;要么就是需要录很多次,或者花费大量精力来调整自己的注意力。
每一次对自己录的效果都不满意,这种纠结和负面情绪对之后再做这件事来说,又是一个减分项。
可能很多刚开始录视频的小伙伴都有这种感觉。
这次更新之后,界面的操作确实有些复杂,还包含了很多细节,录视频确实是最直观的方法。只好咬牙又重新开始录制。但仍然有磕巴,停顿,口头语,声音忽大忽小的问题……
忽然想起去年年底开发了一个视频编辑工具,当时因为忙其他事情,也没怎么用。这次才真正开始用上。
2 借助工具
流程如下:
使用视频会议录屏并导出 mp4
也可以用其他方法进行录屏
...
TabPFN
1 简介
TabPFN(Tabular Prior-Data Fitted Network)是由 Meta AI
团队开发的针对表格数据的神经网络分类器。
1.1 主要特点是
无需超参数调优:TabPFN 与 XGBoost、LightGBM
等传统树模型不同,它即插即用,不需调整超参数。
极快的推理速度:TabPFN
训练和预测时间不到一秒,远超深度学习模型。
基于
Transformer:尽管规模小,它在预训练时利用大量合成数据,实现对新数据集的良好泛化能力。
适合小型数据集(<10K 样本):TabPFN
在小数据集上表现出色,但对大规模数据暂不是最佳。
1.2 适用场景
对于小型表格数据集,希望能够快速获得高质量的分类结果。
不希望投入太多时间在参数调优上,需要一个即插即用的分类器。
2 原理
TabPFN 通过元学习(Meta-Learning)预训练一个
Transformer,让其学习各种合成数据的模式,从而可以在新数据集上实现零训练和极速推理。对于小型表格数据分类任务,它是一个开箱即用且无需调参的强力工具。
3 阶段
预训练阶段(Offline Lear ...
doocs-md
doocs-md 是一个开源的公众号 Markdown 编辑器,能实时将 md
语法渲染成公众号图文,其亮点在于:提供多种 CSS 风格。
目前在 Github 上有 6.9K star
主要语言:Vue3, TypeScript,JavaScript
在线使用:https://doocs.github.io/md/
项目地址:https://github.com/doocs/md
用法:
将 md
文档导入编辑器,选择合适的公众号风格和格式,如果有图片且为本地图,默认需手动依次上传
复制 ->内容粘贴到公众号后台。
doocs-md
的发布功能需要配合浏览器插件“微信公众号同步助手”使用,可将文章发布到多个平台。
支持本地图片转换成线上图片。
问题:
不如 ob 插件上传图片那么方便
优点:
可传多个平台
标题,margin,字体大小都很合适,有一些可选格式
Obsidian文章发布到公众号时的排版方法
1 引言
我们常常使用 obsidian
写文章,发布到公众号和其他公共平台,其中有两个比较麻烦的问题:一个是将
markdown
转换成合适的网页格式,另一个是上传图片。这往往会花费很多时间,尤其是当文章较长,包含各层标题、引用、代码和公式时,需要花费更多的时间。此外,由于公众号文章需要有封面图,文章中也需要一些插图,因此就需要将图从
ob 中复制出来,再上传到公众号平台。
所以一直在找一键发布的方案。找到几个工具可以简化上述操作,但也都有各自问题。比如:
使用壹伴工具进行公众号排版,其中预设了很多风格排版,还可以以插件方式在公众号网页中使用;但是它是收费的,且将
markdown 转为 HTML,以及处理图片的问题仍不可避免。
使用开源工具 doocs-md 直接将 markdown 转成公众号格式的 HTML
也不错。它支持直接输入 markdown
格式,但也无法解决图片上传的问题,且风格相对有限。
安装 Obsidian 插件
obsidian-wechat-public-platform,它可以自动上传图片,将 markdown 转换为
HTML,并保存到公众号草稿箱;但 ...
