相关文章
[阅读笔记20][BTX]Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM
这篇论文是meta在24年3月发表的,它提出的BTX结构融合了BTM和MoE的优点,既能保证各专家模型训练时的高度并行,又是一个统一的单个模型,可以进一步微调。 这篇论文研究了以高效方法训练LLM使其获得各领域专家的能力,例如…
编程日记
2024/11/8 15:48:06
【ElasticSearch】安装
1.官网寻找合适版本下载 这里我选择的是8.11.1
2.解压并启动 然后在浏览器输入http://localhost:9200/,判断是否启动成功
如下所示,则表示启动成功 安装过程中遇到过几个bug,记录在这篇文章中
【ElasticSearch】安装(bug篇&am…
编程日记
2024/11/7 11:25:13
【代理模式】静态代理-简单例子
在Java中,静态代理是一种设计模式,它涉及到为一个对象提供一个代理以控制对这个对象的访问。静态代理在编译时就已经确定,代理类和被代理类会实现相同的接口或者是代理类继承被代理类。客户端通过代理类来访问(调用)被…
编程日记
2024/11/6 20:16:08
electron打包dist为可执行程序后记【electron-quick-start】
文章目录
目录
文章目录
前言
一、直接看效果
二、实现步骤
1.准备dist文件夹
2.NVM管理node版本
3.准备electron容器并npm run start
4.封装成可执行程序
1.手动下载electron对应版本的zip文件,解决打包缓慢问题
2.安装packager
3.配置打包命令执行内容…
编程日记
2024/11/5 1:33:38
【C语言】<动态内存管理>我的C语言终末章
<动态内存管理> 1. 为什么要有动态内存分配2. malloc和free2.1 malloc2.2 free 3. calloc和realloc3.1 calloc3.2 realloc 4.常见的动态内存错误4.1 对NULL指针的解引用操作4.2 对动态开辟空间的越界访问4.3 对非动态开辟内存使用free释放4.4 使用free释…
编程日记
2024/11/9 5:14:29
【第1节】书生·浦语大模型全链路开源开放体系
目录 1 简介2 内容(1)书生浦语大模型发展历程(2)体系(3)亮点(4)全链路体系构建a.数据b 预训练c 微调d 评测e.模型部署f.agent 智能体 3 相关论文解读4 ref 1 简介 书生浦语 InternLM…
编程日记
2024/11/6 15:12:56