Yan 的杂物志_个人主页分享

Created2022-02-27|2_Note0_Technic2_算法12_图神经网络

介绍英文题目：Reasoning on Knowledge Graphs with Debate Dynamics（R2D2）中文题目：基于动态辩论的知识图推理论文地址：https://arxiv.org/pdf/2001.00461.pdf 领域：图神经网络, 知识推理发表时间：2020 出处：AAAI 2020 被引量：6 代码和数据：https://github.com/m-hildebrandt/R2D2 读后感针对问题：基于图的自动知识推理目标：提升对真命题和伪命题的识别，提升可解释性结果：对于分类和链接预测任务均有良好表现，且实现了一些归因。核心方法：利用动态辩论的强化学习算法。这是一个相对白盒的方法采用两个 agent 的对抗，一个找真命题相关路径，一个找假命题相关路径，使用知识图中的路径作为参数生成特征，最终由判别器做出判断推理的真伪。具体模型：深度学习模型，两个 Agent 使用 LSTM，判断使用 MLP 难点：对抗学习应用于图论和知识推理。泛读后理解程度：60% （看完题目、摘要、结论、图表及小标题）精读（只翻译了实现部分） ...

论文阅读_可扩展特征学习Node2Vec

Created2022-02-20|2_Note0_Technic2_算法12_图神经网络

介绍英文题目：node2vec: Scalable Feature Learning for Networks 中文题目：node2vec：面向网络的可扩展特征学习论文地址：https://arxiv.org/abs/1607.00653 领域：图神经网络，知识表示发表时间：2016 出处：KDD 被引量：6181 代码和数据：http://snap.stanford.edu/node2vec/ 参考其它翻译：【论文笔记】node2vec 说明一切皆可 vector 图神经网络经典必读第一篇读后感（看完题目、摘要、结论、图表及小标题看完，约 30 分钟）针对问题：自动学习图中结点和边的特征表示目标：更好地表征图中的节点：兼顾同质性和结构等价性。结果：在多领域与 SOTA 模型对比，展示算法有效性，可在复杂网络中生成任务无关的表征。方法：note2vec 框架，优化随机游走算法，结合深度优先和广度优先两种游走方式，用参数设置游走方式的选择，从而提升效率。精读（核心章节：读 + 整理：3 小时）摘要如果想使用机器学习算法对图中节点和边建模，需要自动学习对图中 ...

streamlit构造Web应用

Created2022-02-12|2_Note0_Technic3_编程Python

StreamLit 构造 Web 应用功能 Streamlit 帮助机器学习工程师快速开发用户交互工具，几乎可取代 Flask 在机器学习项目中的地位。个人感受确实非常方便，安装 python 库的 streamlit 后，可快速入门和学习前端相比，学习成本非常低界面比较美观，适合用于 demo 和内部展示通过简单的代码，就可以展示丰富的功能；但对于复杂的 UI 还没试不需要可见的 b/s 通讯，几乎所有交互都通过操作 streamlit 句柄完成使用很方便，功能是否强大还没试运行需要基于 streamlit 框架安装 1$ pip install streamlit 运行示例 1$ streamlit hello --server.port 8080 我指定了端口，否则其默认运行端口是 8501 在其左侧可以选择几种主要的 demo Pasted image 20220212132427.png 运行程序将其中 dataframe 的 demo 写入一个文件 test.py，然后运行 1$ streamlit run test.py --server. ...

图数据库Neo4j

Created2022-02-12|2_Note0_Technic3_编程数据库

图数据库传统数据库难以处理复杂多跳的关系运算。需要一种支持海量、复杂、且结构灵活的关系运算数据库，图数据库应运而生。 1 相关概念 1.1 简介图数据库由顶点和边组成；主要用于对图数据的增删改查；目前常用的图数据库有 Neo4j，JanuxGraph 等 1.2 使用场景常用于社交、电商、金融、零售、物联网等行业用于关系查询用于遍历复杂关系用于实现复杂的规则：如子图比较、推荐等对于结构化数据，常可使用关系型数据库；对于关系比较多，数据不太规律的情况，则用图数据库 1.3 分类属性图数据库构成：顶点、边、顶点属性、边属性 RDF 图数据库（不支持属性，比较古老，已经不怎么用了）针对文本语义场景产生三元组：subject->predicate->object 1.4 原生图数据库原生图数据库：使用图模型进行数据存储，可以针对图数据做优化，从而带来更好的性能，例如 Neo4j。非原生图数据库：底层存储使用非图模型，在存储之上封装图的语义，适合与其它数据应用配合使用，例如 Titan、JanusGraph 底层采用 KV 存储非图模 ...

VSCode+Docker构建Python开发环境

Created2022-02-08|2_Note0_Technic0_工具编程工具vscode

VSCode+Docker 构建 Python 开发环境 1 优缺点 1.1 优点写代码和调试更方便带语法提示且反应快支持直接在命令行敲命令运行一个工具同时开发调试 Python+JS+HTML.... 方便在各代码文件间跳转生态丰富查找替换方便：可以指定文本或文件夹可对比文件差异 …… 1.2 缺点配置有点麻烦需要一些学习成本 2 方法 2.1 前提假设 vscode 已正常安装，并且已有支持 Python 的 docker 环境 2.2 在 Docker 内安装 ssh 服务 2.2.1 进入 docker 123456789101112$ apt-get install openssh-server$ passwd 输入密码，后面登录时输入$ vim /etc/ssh/sshd_config加入以下三行：PubkeyAuthentication yes #启用公钥私钥配对认证方式 PermitRootLogin yes #允许root用户使用ssh登录 PasswordAuthentication yes$ /etc/init.d/ssh restar ...

3_Obsidian_用Git同步笔记

Created2022-02-06|2_Note0_Technic0_工具笔记工具Obsidian同步

#笔记/Obsidian 问题 Obsidian 需要家里和单位电脑同步，以及定时备份，之前试过使用百度网盘和 Github 备份数据。百度网盘提供了一些 API 上传和下载数据，搭配 Linux 的 crontab 定时任务，能实现基本备份功能，但速度太慢。Github 效果不错，但是常常连不通。这次选择了 Obsidian 的三方插件 +Gitee 结合的方式，设置半小时备份一次，比较完美地解决了备份问题。原理 Obsidian 中的插件只是简单地执行 git pull/commit/pull 等命令，需要先在本机配置好 git 环境，然后与 Obsidian 的定时任务配合实现 push 和 pull 功能。 Gitee 是国内的 Git 服务器，用法和 Github 基本相同，速度比较快，私有数据也免费。方法配置 git 环境注册 gitee，并创建自己的私有仓库 https://gitee.com/ 生成公钥： 1$ ssh-keygen -t rsa -C "xxx@xxx.com" 按提示输入地址为 $HOME/.ssh/id_rsa_g ...

01_环境

Created2022-01-30|2_Note0_Technic3_编程前端

#编程语言/前端 #编程语言/前端搭建环境我在 Ubuntu 下用 VSCODE 搭建前端开发环境，用 Windows 也差不多。 1 VSCode VSCode 是微软推出的可运行于 Mac OS X、Windows 和 Linux 多平台上的源码编辑器，前端开发一般都用它。 1.1 安装下载：https://code.visualstudio.com 下载 deb 包，然后用命令安装 1sudo dpkg -i code_1.63.2-1639562499_amd64.deb 1.2 运行在启动器里输入 code，然后选择 Visual Studio Code 根据提示下载安装中文环境安装两个插件（通过左侧扩展按钮调出） Code Runner HTML CSS Support 打开文件夹（点左侧的资源管理器按钮）创建一个 html 文件，加入简单代码 12345<html> <body> <script>alert('Hello World')</script> </body> ...

02_HTML5

Created2022-01-30|2_Note0_Technic3_编程前端

#编程语言/前端 #编程语言/前端 HTML 1 元素 1.1 原理作为一个操作单位，如被 JS 操作，或者其中的数据都使用同种 CSS 风格…… 1.2 自定义元素定义块元素 1<div> ... </div> 注意：div 中可包含多个元素，即将多个元素分成一组。定义行内元素 1<span> ... </span> 注意：只能把 span 放在其它元素的内部。 1.3 元素属性：id 和 class id 和 class 是元素的属性，不只是自定义元素，所有元素都可以设置 id 和 class，以设置操作和风格。 id id 是元素的字名，应该是独一无二的， class class 是元素它所属类别，多个元素可属于同一类别，它们可以拥有同样的显示风格，同样的操作…… 一个元素还可以属于多个类别形如： 1<div id="ISBN0321127307" class="listing book"> 1.4 通过 id 访问控件 (好像是 JQuery 用法) 1$("#i ...

04_JQuery和Ajax

Created2022-01-30|2_Note0_Technic3_编程前端

JQuery 和 Ajax #编程语言/前端 1 原理 Ajax（阿甲克斯）提供了异步更新的机制，使用客户端与服务器间交换数据而非整个页面文档，实现页面的局部更新。 jQuery 是一个框架（可以当成一个库），封装了一些常用方法，使得 JS 与 Ajax 更方便使用。 2 JQuery JQuery 是一个非常常用的 JS 库，可以直接使用网上的 js，也可以下载到自己的服务端。 2.1.1 直接下载下载地址：https://jquery.com/download/ 点开不压缩版本，即可看到其具体实现，将 js 文件保存到本地，然后在网页中引入即可 1<script src="pathtoyourjs/jquery-3.2.1.min.js"></script> 2.1.2 下载源码（可切换到历史版本）或者从 git 下载 1$ git clone https://github.com/jquery/jquery.git 2.2 AJAX AJAX 是 JQuery 工具集中的一个工具，用于远程请求，以实现局部刷新。 3 示例 3.1 ...

03_JS

Created2022-01-30|2_Note0_Technic3_编程前端

JavaScript #编程语言/前端 #编程语言/前端 1 原理运行在客户端浏览器，不需要服务端资源 2 用途网页中比较复杂的交互，比如提示用户输入错误，点展开列表、输入文字时自动联想…… 3 基本语法 3.1 说明大小写敏感空格无意义（与 Python 不同）建议以分号结尾注释行注释： 1// 我是行注释块注释: 123/*我是注释*/ 3.2 变量不需要显示地声明类型，但需要用 var 定义变量。 12345var foo = null;var foo = true;var foo = 5;var foo = "five";var foo = [5, "five", "5"]; 3.3 操作布尔操作 == 等于 != 不等于 === 类型相同 !== 类型不同 , >=, <, <= 大于、大于等于、小于、小于等于数值操作 ++ 加 1 -- 减 1 += 当前值加逻辑运算 && 逻辑与 || 逻辑或 ! 逻辑非 3.4 条件 12 ...