oldhu's

20 Mar 2023

介绍 Word Embedding是NLP处理的第一步，要将一段文字送入模型，必须先将其转换成数字。Word Embedding将每个词转换成为一个向量。 Word2vec Word2vec是Word Embedding的方法之一。他是20...

16 Mar 2023

seq2seq问题 seq2seq用于将一个序列(sequence)转换成另一个序列，典型的场景是机器翻译，语音识别，给图片生成描述，问答，语音合成，代码生成等。 Encoder-Decoder Encoder-Decoder架构是一种适用...

14 Mar 2023

RNN用于处理序列类型的数据，比如语音，文字。这类数据的最大特点，是后面的信息，与之前的信息有关。比如一句话，每一个字如果是之前信息的函数，那不可能只是前一个字的函数，而是之前很多个字的函数。 RNN神经元结构之前将神经元简化为输入的函数...

13 Mar 2023

CNN是对图像类数据进行处理的最常用方法，主要的思路是通过卷积核对图像的特征进行提取，通过pooling对数据进行降维，然后再通过全链接网络输出。卷积卷积在数学上的概念相对复杂，而在图像处理的CNN中，卷积可以简单地理解为：用一个矩阵与...

03 Mar 2023

神经元结构以下是一个大脑中的神经元的结构：简化来看，大脑的神经元由三部分组成：树突（输入机制）—— 通过突触接受输入的树状结构。输入可能是来自感觉神经细胞的感觉输入，也可能是来自其他神经细胞的“计算”输入。单个细胞可以有多达10万输入...

20 Dec 2022

参考 https://github.com/enricopolanski/functional-programming 基本工具 flow与pipe 先准备几个基本方法 function return1(): number { return...

18 Nov 2022

参考 https://sq.sf.163.com/blog/article/220973851641442304 Clojure中的数据结构(list, vector, map)等，有persistent和transient两种存在形态。 ...

25 Oct 2022

If you call notion API directly from a web page, it will complain about CORS. So we need a proxy to it. rewrite rule in ...

13 Oct 2022

参考：http://www.matrix67.com/blog/archives/234 费马小定理费马在1636年发现这个定理。如果p是质数，a是小于p的正整数，则 $ a^{p-1} \bmod p = 1 $ 证明先证明一个定理：...

11 Oct 2022

腾讯Xuming 基于中文STS-B数据集训练的CoSENT模型，对应的github repo ATEC, BQ, LCQMC, PAWSX, STS-B数据集人民大学数据库与智能信息检索实验室大量的预训练模型对应的huggingfa...