Obsidian插件开发
1 Obidian 开发
Obsidian 基于 Electron 框架开发,其前端主要使用了 HTML、CSS 和
JavaScript,而后端使用了 Node.js。Node.js 是基于 Chrome V8 引擎的
JavaScript 运行环境,使 JavaScript 能在服务器端运行。
在开发 Obsidian 插件时,将涉及 JavaScript 和 Node.js
的相关知识。如:使用 Node.js 提供的模块和 API
来进行文件操作、访问系统资源、处理网络请求等。
2 开发环境
我的开发环境为:VSCode + Node Docker+
Copilot。这样既不影响我的宿主机环境,开发也比较舒服,还可以利用辅助编码工具。
如果想开发 Obsidian 插件,就需要安装 Node.js 环境。Node.js 提供了
JavaScript 运行环境和许多内置模块;同时,安装 Node.js 也会安装
npm,用来管理插件项目的依赖项。
因为之前安装过 node 镜像,这次就直接使用了:
123#$ docker run --name obdev --rm -v /ex ...
github自动编译Release版本
1 原理
GitHub Actions
是一个强大的自动化工具,可以帮助你简化开发流程的各种操作。从测试代码到部署应用,它几乎可以自动化开发中的任何任务。
这里使用它来自动发布 Obsidian 插件。当打 TAG
时,它会触发编译并发布新版本。
2 操作
2.1 设置工作流
在 github 项目中创建一个工作流配置文件
12345mkdir.github/workflows/vi .github/workflows/release.yml # 加上述文档中的内容git add .github/workflows/release.ymlgit commit -m 'xxx'git push
yml 中具体内容见:ob
自动发布教程
2.2 本地测试
在本地安装一个与 yml
文件中类似的环境(node-version)。测试无误后,再上传 GitHub
进行编译。请确保 JSON 配置文件完整。
2.3 打标签即可触发工作流
12git tag -a 1.0.0 -m "1.0.0"git push origin 1.0.0
如果标签错误,需要 ...
论文阅读_大型语言模型增强强化学习调查
12345678中文标题:Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods中文名称: 大型语言模型增强强化学习调查:概念、分类和方法链接: https://arxiv.org/pdf/2404.00282作者: Yuji Cao, Huan Zhao, Yuheng Cheng, Ting Shu, Yue Chen, Guolong Liu, Gaoqi Liang, Junhua Zhao, Jinyue Yan, Yun Li,机构: 香港中文大学日期:2024-03-30引文数量:135长度:正文15页
来自:241011 哲明分享
摘要
目标:
提供对大型语言模型(LLMs)增强强化学习(RL)相关文献的全面综述,明确其与传统
RL 方法的对比,澄清研究范围和未来研究方向。
方法: 基于经典的代理 -
环境互动范式,提出结构化分类法,将 LLMs 在 RL
中的功能系统地划分为信息处理器、奖励设计者、决策者和生成器四个角色。逐一总结方法、 ...
使用辅助编程的一些思考
1 引子
最近使用辅助编程比较频繁,也在思考:
它的出现对程序员来说是利大于弊还是弊大于利。
对非程序员来说,有了辅助编程是否就能达到程序员的水平?
目前,辅助编程还不能解决哪些问题呢?
1.1 使用场景
1.1.1 程序员角度
先从程序员的角度看看。
在熟悉的情境下,当我们面对熟悉的问题时,可能会需要编写大量逻辑代码。在这种情况下,机器可以帮助我们自动生成部分代码,从而加速开发过程。
对于不熟悉的架构和语法,机器辅助变成能够生成整体示例和语法正确的代码,从而避免因为语法错误而浪费时间;帮助理解和快速上手,并且更容易理解系统的工作原理。
在调试过程中,对于一些简单的问题,机器可以提供快速的反馈和解决方案,从而节省我们的时间;对于复杂问题可能无法直接解决,但可以提供一些建议思路,来减少查找和定位的过程。公平地说,与之前手动查找问题相比,提效很多。
辅助编程也有一些问题,如多端联调比较困难;如果一些小众工具没有提供文档,辅助编程工具也不知道如何使用。虽然理论上可以通过
Agent 和 RAG 来解决这些问题,但实际实现起来比较麻烦。
1.1.2 非程序员角度
再从非程序员的角度看看,一 ...
开源项目_语音合成_edge tts
免费使用 Microsoft Edge
项目地址:https://github.com/rany2/edge-tts
1 功能
语音合成支持各种主流语言,并可调节合成速度、音量和音高。我测试了一下,中文
300 字的合成时间约为 3 秒,600 字约为 6 秒。
从效果来看,语气和情感表达比传统技术(相对旧版讯飞)更好,清晰度和准确率也很高。虽然不能定制,但一般用户无需定制,只要合成效果不出戏即可。
2 原理
模拟 edge 浏览器行为,远程调用 microsoft 语音合成服务。
3 安装
1$ pip install edge-tts
4 查看支持的语言和声音
1edge-tts --list-voices
5 合成中文
5.1 命令行调用
1$ edge-tts --text "我正在测试" --write-media hello.mp3 --voice zh-CN-YunxiNeural
5.2 Python 程序调用
12345678import edge_ttsTEXT = "我正在测试"VOICE = "zh-CN-Yun ...
试用_Claude3
1 简介
好消息是,2024 年 3 月 4 日发布了 Claude3,据传比 GPT-4 更好,snooet
版本可以免费试用,坏消息是我们这儿不能用。
在官网注册时,需要选择国家并使用手机接收短信验证码。而在选项中没有中国这个选项。即使成功注册了账号并申请了
API
密钥,免费版本仍需要绑定信用卡才能使用。绑定信用卡也需要接收短信验证,网上说每个手机号只能注册一次,所以似乎也无法短信接收平台。(如果你找到了注册方法,请私信告诉我)
虽然无法通过 API
调用并将其添加到我们的工具中,但可以通过亚马逊云来免费体验一下。
2 Claude3
2.1 三个模型
Claude 3 共发布了三个模型:
Claude 3
Opus:最强大的模型,在高度复杂的任务上提供最先进的性能,并展示流畅性和类似人类的理解。
Claude 3
Sonnet:在智能和速度之间最平衡的模型,是企业工作负载和规模化 AI
部署的绝佳选择
Claude 3
Haiku:最快、最紧凑的模型,旨在实现近乎即时的响应能力和模仿人类交互的无缝
AI 体验
2.2 主要特点
这次升级的主要特点包含:
多语言功能:Cla ...
Agent实战_法律行业模型
1 比赛介绍
第三届琶洲算法大赛 -GLM 法律行业大模型挑战赛道
赛题页面:https://tianchi.aliyun.com/competition/entrance/532221/information
解题示例:https://tianchi.aliyun.com/competition/entrance/532221/customize444
说明文档:https://zhipu-ai.feishu.cn/wiki/M6lCwkSEWiBQIKkQLtIcTuV2nqh?spm=a2c22.12281976.0.0.536f7dd2Pg0INK
2 问题概述
在法律服务领域,基于智谱 GLM-4 大模型和相关业务
API,构建一个能回答法律问题的 Agent(问题机器人)。该 Agent
需要在一小时内回答 200 道问题。
这种整体方案可以应用于许多专业领域。我们也可以通过比较优化和未优化的情况下,看看效果如何。(初赛
A 榜的前 100 名得分都在 80-90
分区间内,查看了一些代码后,我觉得稍加改进也能达到 70+)
3 问题类型
简单问题:查单表和几个字段。 ...
关于Agent的一些思考_240429
何需足量革,尽覆此大地,片革垫靴底,即同覆大地。 --
寂天《入行论》
最近看了一些 LLM 实测报告,感觉 LLM
的能力很强大,但在当前阶段,仍然只能对单一简单问题进行一次提问(详见:开源项目_大海捞针测试),对于复杂的问题,可以通过将其拆解为多个简单问题,使用
LLM 进行多步问答来解决。因此,引入了
Agent。目前也临着在对话过程中容易偏离主题的问题(详见:论文阅读_多Agent_股票操作示例)。
猜想大模型的尽头并非某个全能的大模型,而是类似于人的存在,可能是面向
Agent 优化的大模型;或者整体系统由多个大模型组成,其中一个充当主控:
这个主控模型并不大,所以反应速度快。
他并不存储所有的知识,但包含:内在信念(详见:论文阅读_语言与决策_通过LENS看人类行为),基本的常识,语言理解能力,基础推理能力,类似于高中生的水平。
他链接到一个外挂记忆系统,该系统存储客观知识和主观总结,以及长短期记忆,支持存储/搜索(详见:文章阅读_Agent记忆机制综述)。
他还包含一个自我进化系统,该系统能记忆、总结,并推动自已更新能力库。
和当前系统很大差别在于它能自主构建自己的 ...
图形化的Agent工具
1 图形化 Agent 工具
1.1 核心组件
机器人 Bot:一个 AI 应用,或称为 Agent
知识库:上传个人数据,机器人可根据其内容进行回复
工作流:将大问题拆解成多个小问题,通过路径实现,路径上的每个节点完成特定任务
插件:调用外部功能(Tools)
1.2 使用体验
大模型与其他元素结合,实现完整的目标功能。
功能:调用工具、设置工作流和本地数据(知识库)。
工具:有许多现成工具可供使用。
工作流:前后关系非常直观,像搭积木一样。
2 Coze
扣子是一个 AI 应用开发平台,由字节跳动推出。
相对更 toC,无需编程即可实现 agent 的创建和发布,效果有点类似于 AI
界的微信小程序。
区别
海外版
国内版
网址
www.coze.com
www.coze.cn
登陆方式
需要魔法才能使用
无使用的网络限制
可用模型
OpenAI GPT 系列
字节自研模型/国内常用模型
发布平台
Discord、Instagram、Slack
飞书、微信客服、微信公众号&订阅号
3 Dify
支持本地搭建和使用本地模 ...
软件版权 License
1 如何选择
GPLv2:允许用户自由地使用、修改和分发。但如果你修改和发布了修改后的版本,必须保持它的开源状态。(允许商用,但如果你分发基于
GPLv2 的修改软件,你必须提供源代码,并以 GPLv2 许可证发布)
GPLv3 与更多许可证兼容,GPLv2 的兼容性较差。允许 GPLv3 代码与 Apache
License 2.0 等许可证一起使用,拓宽了软件的使用范围。
LGPL 是介于完全自由的许可证(如 MIT、BSD)和严格的 GPL
许可证之间的一种折中。它允许闭源软件使用 LGPL 库,同时确保对 LGPL
库本身的修改保持开源。
MIT:非常宽松,允许开发者在任何项目中使用、修改、分发代码,包括在闭源的商业软件中使用,而不需要公开源代码。(允许用于商业用途)
Apache License
2.0:是一种“宽松”的许可证,允许在开源和闭源项目中自由使用、修改和分发代码。你可以将
Apache
许可证的代码整合进商业软件中,而不需要开源你的代码。唯一的要求是保留原始的版权声明和许可证文本。
其它
BSD 系列 (BSD-2, BSD-3): 宽松的许可证,允许闭源使用 ...