训练智能体vs养娃
1 引言
这周我做了一些关于智能体的实现,也参加了幼儿园的家长会,有一些碰撞和感想。
2 什么重要什么不重要
2.1 不重要
数学学不好没关系,我们有推理工具。
语文学不好也没关系,工具可以帮助架构、润色和总结。
英语学不好也无所谓,现在英文文档和中文几乎没有区别。
副科只需要大概了解一点就行了。
音体美多数人都没有那个天赋。
记性不好,有第二大脑的加持。
2.2 重要
体力:身体是一切的本钱;具有自我保护的能力。
心力:乐观,可以敏感,但不要太脆弱。
自主力:拥有主体感和好奇心。
平常心:虽然有智力和体力超人存在,但我们是普通人。
3 自发学习
前两天去幼儿园开家长会时,看到了一张图片。以前,这种图片可能被视为反面教材,但现在老师们鼓励这种行为。说:“小朋友自己发现了一个游戏,叫爬树。”
从幼儿园开始,他们就锻炼孩子的自主性。
|200
在训练智能体时,有一个很高级的阶段叫自我进化。这是指智能体自己设计一系列活动,以提升某种技能。
不能说给孩子买了个益智玩具,他玩这个就算学习。而如果他自己接了杯水,在几个容器里倒来倒去,弄得到处都是水,这就是捣乱吗?这可能反而是一种更为 ...
VSCode调试
1 基本调试
打开 Python 文件。
在行号左侧设置断点(红色圆点)。
在左侧栏打开调试视图(Ctrl+Shift+D)。
创建配置调试文件 launch.json。
如果需要调试第三方库,在 configurations
中添加:"justMyCode": false,
开始调试:点击视图上方的运行按钮(F5)。
在断点界面可以删除所有断点。
2 调试 vscode 程序
修改 launch.json 如下:
12345678910111213141516171819202122{ "version": "0.2.0", "configurations": [ { "name": "Django", "type": "python", "request": "launch", ...
Linux驱动
安装绿能无线网卡
1 问题描述
我笔记本自带的无线网卡最近经常出现问题。一会儿能连通,一会儿又连不通,尤其是在信号弱的情况下,每十分钟就断一次。于是,我在某宝花了
30 元买了一个 USB 无线网卡。
它自带的 U 盘和说明书只有 Windows 安装说明(但盒子上写着也支持
Linux),所以我花了一些时间来安装。
2 环境
USB 无线网卡:绿能 AX300
系统:Ubuntu 22.04
3 安装
3.1 查看设备
12$ lsusb# 插上后看到 aicsemi Aic MSC
3.2 驱动下载
绿联:https://www.lulian.cn/download/list-32-cn.html
查看包装盒上的具体型号(产品参数 -
产品型号),然后搜索并下载对应的驱动程序。
我购买的芯片型号是:AIC8800FC
3.3 安装
下载相应的驱动,解压后找到对应的安装文档(PDF),并按照文档操作(仅运行
install.sh 是不够的)。
我在安装 deb 包时遇到错误,用 make install
自行编译也报错。可能是驱动与我的 Linux
内核版本不兼容。做了一些 ...
论文阅读_大模型自主代理综述
12345678英文名称: A Survey on Large Language Model based Autonomous Agents中文名称: 基于大型语言模型的自主代理研究综述链接: https://link.springer.com/article/10.1007/s11704-023-2640-9链接: https://arxiv.org/pdf/2308.11432作者: Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhi-Yuan Chen, Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen机构: 中国人民大学高灵智能学院日期: Published: 22 March 2024 (以下为20240404版)引用次数: 471
摘要
目标:
对基于大型语言模型(LLM)的自主代理进行系统综述,包括其构建、应用以及评估策略,并提出未来研究的挑战和方向。
方法: 提出一个统一框架来 ...
Navicat 免费版_简单评测
1 引子
之前切换成了支持词嵌入的 pgsql 版本,所以 Navicat 15
就不能用了。而且在 Linux 上使用 Navicat 也很麻烦。后来我换成了
dbeaver,虽然有些不适应,但功能都支持。
最近听说 Navicat 出了轻量级的免费版,而且可以在 Linux
下直接运行,于是就下载试试。
2 安装
2.1 下载
官网:https://www.navicat.com/en/products/navicat-premium-lite
在主页点击右上角的“Free Download”。
当前最新版本为:navicat17-premium-lite-en-x86_64.AppImage,这似乎是
navicat17 的一个衍生版,大小为 237M。
2.2 运行
直接运行即可
12$ chmod 777 navicat17-premium-lite-en-x86_64.AppImage$ ./navicat17-premium-lite-en-x86_64.AppImage
3 测试
我简单地测试了一下 pgsql:
界面是传统的 Navicat 界面,从易用性来看, ...
论文阅读_字节的语音生成模型_Seed-TTS
12345678英文名称: Seed-TTS: A Family of High-Quality Versatile Speech Generation Models中文名称: Seed-TTS:高质量多功能语音生成模型系列链接: http://arxiv.org/abs/2406.02430v1代码: https://github.com/BytedanceSpeech/seed-tts-eval (评测工具)演示网站:https://bytedancespeech.github.io/seedtts_tech_report/作者: Seed Team机构: 字节跳动日期: 2024-06-04
摘要
目标:提出
Seed-TTS,一种大规模自回归文本转语音模型,主要用于生成几乎无法区分人类语音的语音。
方法:提出了自蒸馏方法用于语音因子分解,以及强化学习方法用于增强模型鲁棒性、说话者相似度和可控性。另外,提出了一种非自回归(NAR)变体
Seed-TTS_DiT,采用全扩散式架构。
结论:Seed-TTS
在说话者相似度和自然度方面表现出色,通过微调实现了更高的主观评分。Seed- ...
阿里开源的音频模型_原理与实操
123456789英文名称: FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs中文名称: FunAudioLLM: 人与LLMs之间自然互动的语音理解和生成基础模型论文地址: http://arxiv.org/abs/2407.04051v3相关论文:https://fun-audio-llm.github.io/pdf/CosyVoice_v1.pdf代码: https://github.com/FunAudioLLM官网介绍:https://fun-audio-llm.github.io/作者: Tongyi SpeechTeam机构: 阿里巴巴集团,通义Speech团队日期: 2024-07-04
读后感
FunAudioLLM 工具集在 24 年 7
月初开源,核心包含两个语音模型:SenseVoice 和 CosyVoice。
模型(SenseVoice 和 CosyVoice)已在 Modelsco ...
ChatTTS使用方法/源码分析/评测/相关资源
1 引言
5 月开源的 ChatTTS,最近文章十篇里有五篇以上都在讨论它。很多新的 TTS
模型也用它来做比较。感觉没用过 ChatTTS 都不敢评测其他的。
目前,ChatTTS 支持英文和中文。在 arxiv
上没找到相关论文,所以本文主要评测使用感受。
(下文仅代表个人观点)
2 主要资源
Github: https://github.com/2noise/ChatTTS,目前 27.4K Star
HuggingFace: https://huggingface.co/2Noise/ChatTTS
3 使用方法
3.1 安装
为了避免影响现有环境,我在 Docker 镜像中进行安装,选择了 PyTorch
官方提供的镜像。由于软件依赖于 PyTorch
2.1.0,版本要求较高,所以我下载了重新的 Docker 镜像。
12345678$ git clone https://github.com/2noise/ChatTTS.git$ docker pull pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime$ nvidia-do ...
论文阅读_语义嵌入_电子商务搜索中的多阶段多粒度学习
12345678英文名:Learning Multi-Stage Multi-Grained Semantic Embeddings for E-Commerce Search中文名:学习多阶段多粒度语义嵌入用于电子商务搜索时间:20 Mar 2023(v1)地址: https://arxiv.org/pdf/2303.11009作者:Binbin Wang, Mingming Li, Zhixiong Zeng, Jingwei Zhuo, Songlin Wang, Sulong Xu, Bo Long, Weipeng Yan机构:京东出处:ACM Web Conference 2023 会议论文正文:4 页
1 读后感
论文的使用场景是海量数据的电子商务搜索,目的是在十亿级语料库中找到相关项目,同时确保低延迟和计算成本。这项工作的痛点在于检索阶段需要整合多级信息。
当前的主流技术是基于嵌入的检索方法,采用双塔框架分别学习查询和项目的嵌入向量,从而利用高效的近似最近邻(ANN)搜索来检索相关项目。现有的搜索系统主要采用“检索
- 预排序 - 排名”的多阶段架构。这篇论文主要讨论检 ...
论文阅读_基于多模态嵌入的产品搜索
12345678英文名:Que2Engage: Embedding-based Retrieval for Relevant and Engaging Products at Facebook Marketplace中文名:Que2Engage:基于嵌入的检索功能,在 Facebook Marketplace 上搜索相关且引人入胜的产品地址:https://arxiv.org/abs/2302.11052v1时间:21 Feb 2023(v1)作者:He Yunzhong and Tian Yuxin and Wang Mengjiao and Chen Feier and Yu Licheng and Tang Maolong and Chen Congcong and Zhang Ning and Kuang Bin and Prakash Arul机构:Meta,加州大学默塞德分校出处:会议:2023 年 ACM 网络会议的配套论文集正文:4 页
1 读后感
论文优化了 Facebook Marketplace 中的搜索功能。Facebook Marketplace
是一个电子商 ...