22 May 2023

Open Source LLM

排名 基于lmsys arena Rank Name 1 vicuna-13b 2 koala-13b 3 RWKV-4-Raven-14B 4 oasst-pythia-12b 5 chatglm-6b 6 stablelm-tuned-...
10 May 2023

HackerNews上值得关注的新闻(4)

See this page fetch itself, byte by byte, over TLS 基于一个纯JS的tls库,在浏览器里展示出TLS客户端从握手到获取数据的过程。 Language models can explain n...
10 May 2023

LoRA Intro

LoRA是Low-Rank Adaptation的缩写,出自论文Low-Rank Adaptation of Large Language Models LoRA是一种用于大语言模型的低秩(Rank)fine tune方法,它可以在不增加模...
28 Apr 2023

HackerNews上值得关注的新闻(3)

Datomic is Free Datomic是Rich Hickey对Database As a Value的终极理解,使用 Datalog作为查询语言。DataScript是Datomic用JavaScript 的开源实现,是Roam,...
27 Apr 2023

Transformers from Scratch

翻译自: https://e2eml.school/transformers.html 对论文Attention Is All You Need的解读。 one-hot encoding 中文叫独热编码或者一位有效编码,是指用一个N维向量表...
24 Apr 2023

HackerNews上值得关注的新闻(2)

Scaling Transformer to 1M tokens and beyond with RMT 此论文提出了一种方法,让BERT可以支持1M个token nl在评论中,提到另一篇论文Why Can GPT Learn In-Con...