Yan 的杂物志_个人主页分享

Created2024-09-01|2_Note0_Technic0_工具编程工具vscode

1 基本调试打开 Python 文件。在行号左侧设置断点（红色圆点）。在左侧栏打开调试视图（Ctrl+Shift+D）。创建配置调试文件 launch.json。如果需要调试第三方库，在 configurations 中添加："justMyCode": false, 开始调试：点击视图上方的运行按钮（F5）。在断点界面可以删除所有断点。 2 调试 vscode 程序修改 launch.json 如下： 12345678910111213141516171819202122{ "version": "0.2.0", "configurations": [ { "name": "Django", "type": "python", "request": "launch", ...

绿能无线网卡安装指南

Created2024-09-01|2_Note0_Technic4_系统Linux驱动

安装绿能无线网卡 1 问题描述我笔记本自带的无线网卡最近经常出现问题。一会儿能连通，一会儿又连不通，尤其是在信号弱的情况下，每十分钟就断一次。于是，我在某宝花了 30 元买了一个 USB 无线网卡。它自带的 U 盘和说明书只有 Windows 安装说明（但盒子上写着也支持 Linux），所以我花了一些时间来安装。 2 环境 USB 无线网卡：绿能 AX300 系统：Ubuntu 22.04 3 安装 3.1 查看设备 12$ lsusb# 插上后看到 aicsemi Aic MSC 3.2 驱动下载绿联：https://www.lulian.cn/download/list-32-cn.html 查看包装盒上的具体型号（产品参数 - 产品型号），然后搜索并下载对应的驱动程序。我购买的芯片型号是：AIC8800FC 3.3 安装下载相应的驱动，解压后找到对应的安装文档（PDF），并按照文档操作（仅运行 install.sh 是不够的）。我在安装 deb 包时遇到错误，用 make install 自行编译也报错。可能是驱动与我的 Linux 内核版本不兼容。做了一些 ...

论文阅读_大模型自主代理综述

Created2024-08-21|2_Note0_Technic2_算法7_模型增强AgentAgent论文

12345678英文名称: A Survey on Large Language Model based Autonomous Agents中文名称: 基于大型语言模型的自主代理研究综述链接: https://link.springer.com/article/10.1007/s11704-023-2640-9链接: https://arxiv.org/pdf/2308.11432作者: Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang, Zhi-Yuan Chen, Jiakai Tang, Xu Chen, Yankai Lin, Wayne Xin Zhao, Zhewei Wei, Ji-Rong Wen机构: 中国人民大学高灵智能学院日期: Published: 22 March 2024 (以下为20240404版)引用次数: 471 摘要目标: 对基于大型语言模型（LLM）的自主代理进行系统综述，包括其构建、应用以及评估策略，并提出未来研究的挑战和方向。方法: 提出一个统一框架来 ...

Navicat免费版评测

Created2024-08-07|2_Note0_Technic3_编程数据库

1 引子之前切换成了支持词嵌入的 pgsql 版本，所以 Navicat 15 就不能用了。而且在 Linux 上使用 Navicat 也很麻烦。后来我换成了 dbeaver，虽然有些不适应，但功能都支持。最近听说 Navicat 出了轻量级的免费版，而且可以在 Linux 下直接运行，于是就下载试试。 2 安装 2.1 下载官网：https://www.navicat.com/en/products/navicat-premium-lite 在主页点击右上角的“Free Download”。当前最新版本为：navicat17-premium-lite-en-x86_64.AppImage，这似乎是 navicat17 的一个衍生版，大小为 237M。 2.2 运行直接运行即可 12$ chmod 777 navicat17-premium-lite-en-x86_64.AppImage$ ./navicat17-premium-lite-en-x86_64.AppImage 3 测试我简单地测试了一下 pgsql：界面是传统的 Navicat 界面，从易用性来看， ...

论文阅读_字节的语音生成模型_Seed-TTS

Created2024-07-17|2_Note3_Paper0_AITTS

12345678英文名称: Seed-TTS: A Family of High-Quality Versatile Speech Generation Models中文名称: Seed-TTS：高质量多功能语音生成模型系列链接: http://arxiv.org/abs/2406.02430v1代码: https://github.com/BytedanceSpeech/seed-tts-eval (评测工具)演示网站：https://bytedancespeech.github.io/seedtts_tech_report/作者: Seed Team机构: 字节跳动日期: 2024-06-04 摘要目标：提出 Seed-TTS，一种大规模自回归文本转语音模型，主要用于生成几乎无法区分人类语音的语音。方法：提出了自蒸馏方法用于语音因子分解，以及强化学习方法用于增强模型鲁棒性、说话者相似度和可控性。另外，提出了一种非自回归（NAR）变体 Seed-TTS_DiT，采用全扩散式架构。结论：Seed-TTS 在说话者相似度和自然度方面表现出色，通过微调实现了更高的主观评分。Seed- ...

阿里开源的音频模型_原理与实操

Created2024-07-15|2_Note3_Paper0_AITTS

123456789英文名称: FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs中文名称: FunAudioLLM: 人与LLMs之间自然互动的语音理解和生成基础模型论文地址: http://arxiv.org/abs/2407.04051v3相关论文：https://fun-audio-llm.github.io/pdf/CosyVoice_v1.pdf代码: https://github.com/FunAudioLLM官网介绍：https://fun-audio-llm.github.io/作者: Tongyi SpeechTeam机构: 阿里巴巴集团，通义Speech团队日期: 2024-07-04 读后感 FunAudioLLM 工具集在 24 年 7 月初开源，核心包含两个语音模型：SenseVoice 和 CosyVoice。模型（SenseVoice 和 CosyVoice）已在 Modelsco ...

ChatTTS使用方法/源码分析/评测/相关资源

Created2024-07-10|2_Note3_Paper0_AITTS

1 引言 5 月开源的 ChatTTS，最近文章十篇里有五篇以上都在讨论它。很多新的 TTS 模型也用它来做比较。感觉没用过 ChatTTS 都不敢评测其他的。目前，ChatTTS 支持英文和中文。在 arxiv 上没找到相关论文，所以本文主要评测使用感受。（下文仅代表个人观点） 2 主要资源 Github: https://github.com/2noise/ChatTTS，目前 27.4K Star HuggingFace: https://huggingface.co/2Noise/ChatTTS 3 使用方法 3.1 安装为了避免影响现有环境，我在 Docker 镜像中进行安装，选择了 PyTorch 官方提供的镜像。由于软件依赖于 PyTorch 2.1.0，版本要求较高，所以我下载了重新的 Docker 镜像。 12345678$ git clone https://github.com/2noise/ChatTTS.git$ docker pull pytorch/pytorch:2.1.0-cuda11.8-cudnn8-runtime$ nvidia-do ...

论文阅读_语义嵌入_电子商务搜索中的多阶段多粒度学习

Created2024-07-01|2_Note0_Technic2_算法17_知识表示

12345678英文名：Learning Multi-Stage Multi-Grained Semantic Embeddings for E-Commerce Search中文名：学习多阶段多粒度语义嵌入用于电子商务搜索时间：20 Mar 2023（v1）地址: https://arxiv.org/pdf/2303.11009作者：Binbin Wang, Mingming Li, Zhixiong Zeng, Jingwei Zhuo, Songlin Wang, Sulong Xu, Bo Long, Weipeng Yan机构：京东出处：ACM Web Conference 2023 会议论文正文：4 页 1 读后感论文的使用场景是海量数据的电子商务搜索，目的是在十亿级语料库中找到相关项目，同时确保低延迟和计算成本。这项工作的痛点在于检索阶段需要整合多级信息。当前的主流技术是基于嵌入的检索方法，采用双塔框架分别学习查询和项目的嵌入向量，从而利用高效的近似最近邻（ANN）搜索来检索相关项目。现有的搜索系统主要采用“检索 - 预排序 - 排名”的多阶段架构。这篇论文主要讨论检 ...

论文阅读_基于多模态嵌入的产品搜索

Created2024-06-30|2_Note0_Technic2_算法17_知识表示

12345678英文名：Que2Engage: Embedding-based Retrieval for Relevant and Engaging Products at Facebook Marketplace中文名：Que2Engage：基于嵌入的检索功能，在 Facebook Marketplace 上搜索相关且引人入胜的产品地址：https://arxiv.org/abs/2302.11052v1时间：21 Feb 2023（v1）作者：He Yunzhong and Tian Yuxin and Wang Mengjiao and Chen Feier and Yu Licheng and Tang Maolong and Chen Congcong and Zhang Ning and Kuang Bin and Prakash Arul机构：Meta，加州大学默塞德分校出处：会议：2023 年 ACM 网络会议的配套论文集正文：4 页 1 读后感论文优化了 Facebook Marketplace 中的搜索功能。Facebook Marketplace 是一个电子商 ...

论文阅读_基于嵌入的Facebook搜索

Created2024-06-29|2_Note0_Technic2_算法17_知识表示

12345678英文名称：Embedding-based Retrieval in Facebook Search中文名称：基于嵌入式检索的Facebook搜索时间： Wed, 29 Jul 2020 (v2)地址：https://arxiv.org/abs/2006.11632作者：Jui-Ting Huang, Ashish Sharma, Shuying Sun, Li Xia, David Zhang, Philip Pronin, Janani Padmanabhan, Giuseppe Ottaviano, Linjun Yang机构：Facebook & Microsoft出处：会议论文，第26届 ACM SIGKDD 知识发现和数据挖掘会议论文集正文：8 页读后感 Facebook 社交中的搜索与其它搜索不同，它可以基于上下文得到更多信息。这里研究的是如何将传统搜索与基于向量的搜索结合在一起的具体方法。比较有启发的是提出的“统一嵌入模型”，在编码时加入了用户、上下文、位置等文本以外的信息，以便更好地定位和匹配。另外，还考虑到每月活跃用户、最近发生的事件、热 ...