论文阅读_Search-R1:大模型+搜索引擎
1234567英文名称:Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning中文名称:Search-R1:训练大型语言模型进行推理并利用搜索引擎的强化学习链接: http://arxiv.org/pdf/2503.09516v2代码: https://github.com/PeterGriffinJin/Search-R1 (1.4K Star)作者: Bowen Jin, Hansi Zeng, Zhenrui Yue, Dong Wang, Hamed Zamani, Jiawei Han机构: 伊利诺伊大学厄巴纳-香槟分校,马萨诸塞大学阿默斯特分校日期:2025-03-12
1 读后感
由于大语言模型(LLM)的知识更新不够迅速,LLM
结合搜索的应用场景变得非常普遍。未来的发展趋势可能会是“小而美”的 LLM
与强大的 Agent、工具、搜索、RAG 等结合,而不是追求“大而全”的 LLM
来解决所有问题。
这篇文章主要探讨大模型与搜索的结合策略:如何 ...
录视频有感_聊聊一种技不如人的羞愧感
1 录制实感
今天想分享一些录视频过程的感受:一种技不如人的“羞愧感”。
录几个视频介绍我开源工具的用法,这个任务已经列在我的周计划里,可能都有十周以上了,但一直没有录。一方面是因为界面一直在更改,一方面是我对录视频这件事非常抵触。别提把人录上了,哪怕只是录个声音,我都感到很有压力。
可能是平时看视频的时候,给我推荐的都是一些顶尖 UP
主的视频,质量很高,我就觉得别人的水平都很高。录的时候会不自觉地预测别人的反馈,注意力没办法集中在内容上,就更加磕磕绊绊的;要么就是需要录很多次,或者花费大量精力来调整自己的注意力。
每一次对自己录的效果都不满意,这种纠结和负面情绪对之后再做这件事来说,又是一个减分项。
可能很多刚开始录视频的小伙伴都有这种感觉。
这次更新之后,界面的操作确实有些复杂,还包含了很多细节,录视频确实是最直观的方法。只好咬牙又重新开始录制。但仍然有磕巴,停顿,口头语,声音忽大忽小的问题……
忽然想起去年年底开发了一个视频编辑工具,当时因为忙其他事情,也没怎么用。这次才真正开始用上。
2 借助工具
流程如下:
使用视频会议录屏并导出 mp4
也可以用其他方法进行录屏
...
TabPFN
1 简介
TabPFN(Tabular Prior-Data Fitted Network)是由 Meta AI
团队开发的针对表格数据的神经网络分类器。
1.1 主要特点是
无需超参数调优:TabPFN 与 XGBoost、LightGBM
等传统树模型不同,它即插即用,不需调整超参数。
极快的推理速度:TabPFN
训练和预测时间不到一秒,远超深度学习模型。
基于
Transformer:尽管规模小,它在预训练时利用大量合成数据,实现对新数据集的良好泛化能力。
适合小型数据集(<10K 样本):TabPFN
在小数据集上表现出色,但对大规模数据暂不是最佳。
1.2 适用场景
对于小型表格数据集,希望能够快速获得高质量的分类结果。
不希望投入太多时间在参数调优上,需要一个即插即用的分类器。
2 原理
TabPFN 通过元学习(Meta-Learning)预训练一个
Transformer,让其学习各种合成数据的模式,从而可以在新数据集上实现零训练和极速推理。对于小型表格数据分类任务,它是一个开箱即用且无需调参的强力工具。
3 阶段
预训练阶段(Offline Lear ...
SVG
1 引言
在前端开发中常用的图标通常是 SVG 格式的。SVG
是一种矢量图形格式,可以根据背景变色,且在缩放时边缘不会模糊。像常用的
Element Plus Icon 就是使用 SVG
格式实现的。不过,有时候会找不到我们想要的图标,比如“另存为”、“剪切板”等。引入其他图标集可能也未必包含所有需要的图标。此外,这样做改动太大,还需要确保所有图标在风格上的一致性(例如宽度、弧度的一致)。因此,需要自己制作一些图标。
2 SVG 简介
SVG 是一种使用 XML 定义的可缩放矢量图形。
具体的 SVG
文件请参见:https://github.com/element-plus/element-plus-icons/ 中
packages/svg 目录下。
建议以现有的图标为基础,以复制粘贴和调整为主。
2.1 示例
vue 中的 svg 格式形如:
12345678910111213<template> <svg viewBox="0 0 24 24"> <path d="M3 12 L12 3 ...
doocs-md
doocs-md 是一个开源的公众号 Markdown 编辑器,能实时将 md
语法渲染成公众号图文,其亮点在于:提供多种 CSS 风格。
目前在 Github 上有 6.9K star
主要语言:Vue3, TypeScript,JavaScript
在线使用:https://doocs.github.io/md/
项目地址:https://github.com/doocs/md
用法:
将 md
文档导入编辑器,选择合适的公众号风格和格式,如果有图片且为本地图,默认需手动依次上传
复制 ->内容粘贴到公众号后台。
doocs-md
的发布功能需要配合浏览器插件“微信公众号同步助手”使用,可将文章发布到多个平台。
支持本地图片转换成线上图片。
问题:
不如 ob 插件上传图片那么方便
优点:
可传多个平台
标题,margin,字体大小都很合适,有一些可选格式
Obsidian文章发布到公众号时的排版方法
1 引言
我们常常使用 obsidian
写文章,发布到公众号和其他公共平台,其中有两个比较麻烦的问题:一个是将
markdown
转换成合适的网页格式,另一个是上传图片。这往往会花费很多时间,尤其是当文章较长,包含各层标题、引用、代码和公式时,需要花费更多的时间。此外,由于公众号文章需要有封面图,文章中也需要一些插图,因此就需要将图从
ob 中复制出来,再上传到公众号平台。
所以一直在找一键发布的方案。找到几个工具可以简化上述操作,但也都有各自问题。比如:
使用壹伴工具进行公众号排版,其中预设了很多风格排版,还可以以插件方式在公众号网页中使用;但是它是收费的,且将
markdown 转为 HTML,以及处理图片的问题仍不可避免。
使用开源工具 doocs-md 直接将 markdown 转成公众号格式的 HTML
也不错。它支持直接输入 markdown
格式,但也无法解决图片上传的问题,且风格相对有限。
安装 Obsidian 插件
obsidian-wechat-public-platform,它可以自动上传图片,将 markdown 转换为
HTML,并保存到公众号草稿箱;但 ...
obsidian插件_文章上传微信公众号
1 方法一: obsidian wechat
public plugin
1.1 信息概述
插件名称: obsidian-wechat-public-platform
主要功能: 一键将 Obsidian 中的文章上传到微信公众号
项目地址:
https://github.com/ai-chen2050/obsidian-wechat-public-platform
介绍视频:
https://www.bilibili.com/video/BV1re411z7Ey/?t=13.4&vd_source=eef058f284e51ad4598d556801a9fc84
代码量: 超过 2000 行 TypeScript
核心代码位置: api.ts
1.2 使用体验
可上传含图片的文章、封面、素材,且支持 CSS 风格。
更新频率不高,但代码简洁,便于自定义。
我主要使用的功能是上传到草稿箱。
换了位置后,IP 老得重设。
1.3 设置步骤
安装插件。
在设置界面输入 appid 和 secret,点击 connect 获取
token,取自公众号开发平台:
在待 ...
旅行_2025
1 思考一
去旅行,发现最近的旅程越来越像我之前独自旅行的某些时刻:去没去过的地方,有独处思考的时间和空间,观察周围的人,回顾和反思这段时间的工作和生活态度。
最喜欢的是在后半夜进行机场转机,也有那没素质的人强行占座挤来挤去,但也有互不打扰的安静时刻。后半夜,大家都放松下来、有些迷糊的状态,有点像微醺的感觉。在大厅里溜达溜达,刷了一些平时可能不会点开的视频,就像打开了一扇窗。
对我而言,和平时不一样的心理体验有时候比风景更为重要,就像是加入一波新数据训练模型——在陌生的不稳态里,寻找自己相对的稳态。
跳出生活,打断”自动驾驶“模式,能更加清晰地感到自己是怎样的人,自己的舒适区在哪儿。我一个人独处或是处于陌生人当中,不必顾虑人际关系,完全没有内耗。如果非要在安全感和自主性之间二选一,我肯定是选择后者。
2 思考二
旅行回来后,感到活力和行动力大增,表现出来是更多的购物和计划。以前很多事情只是想想一放弃了,现在会在第一时间行动。这可能是因为在旅行途中不断遇到的分岔口和决策点,内心的冲突与达成目标的兴奋以及未达成目标的遗憾。这一切,让人意识到天气的变化如何影响风景的不同,时间的差异也会导致价 ...
玉米面发糕
1 实验一
1.1 用料
玉米面 250g
白面 250g
开水 250ml
牛奶 100ml
鸡蛋两个
干酵母 5g
枣:适量
1.2 做法
把 250 开水倒入 250 克玉米面,烫面,然后晾凉
再加入白面、干酵母、鸡蛋、牛奶,和成面团,
放入模具,加枣
放 30-40 度发面 1 小时
凉水上锅,大火,水开后蒸 25-30 分钟
关火后闷 2-3 分钟
1.3 效果
中间有点粘
可能原因:
放了鸡蛋
中间火开小了
太厚
用蛋糕模具不透气
1.4 参考
https://haokan.baidu.com/v?pd=wisenatural&vid=11253467882059041522
2 实验二
2.1 用料
玉米面 100g
白面 100g
牛奶 150ml
干酵母 3g
泡打粉 3g
细砂糖 15g
枣:适量
2.2 做法
面粉、玉米面、泡打粉、糖,酵母混合均匀
将牛奶倒入面粉中,揉成面团
放入模具,30-40 发酵 1 小时,加枣
凉水上锅,大火,水开后蒸 25-30 分钟
关火后闷 2-3 分钟
2.3 效果
相比之前的,中间不粘,原因 ...
browser-use
1 介绍
原理:基于 Langchain 开发
方法:可以在 Python 程序中调用,或通过脚本使用
运行:运行后,会自动打开浏览器,并进行搜索等操作获得结果
用途:适用于获取实时信息,例如股价、天气等
源码地址: https://github.com/browser-use/browser-use
代码分析:以 Python 为主,目前 5000+ 代码
2 用法
2.1 使用 venv 虚拟环境
1234sudo apt install python3.12-venvmkdir /exports/env_broswer-usepython3 -m venv /exports/env_broswer-usesource /exports/env_broswer-use/bin/activate
2.2 安装 browser-use
12pip install browser-useplaywright install
2.3 运行 demo
123456789101112131415161718192021222324252627# test_browser_use.pyfro ...