相关文章
大模型微调之 在亚马逊AWS上实战LlaMA案例(八)
大模型微调之 在亚马逊AWS上实战LlaMA案例(八)
微调技术
Llama 等语言模型的大小超过 10 GB 甚至 100 GB。微调如此大的模型需要具有非常高的 CUDA 内存的实例。此外,由于模型的大小,训练这些模型可能会非常慢。因此,…
编程日记
2024/12/19 3:37:51
Docker镜像加速
问题
Docker下载镜像太慢 docker pull 耗费很多时间 解决办法
vi /etc/docker/daemon.json
内容:
{"registry-mirrors": ["https://sf9c2jyp.mirror.aliyuncs.com"]
}
编程日记
2024/12/15 7:36:35
宝塔面板如何删除一个站点
我们一般的网站都是PHPMySQL开发的,所以删除站点,就要先删数据库,再删网站目录 注意:一点要确保无用的再删 删除站点目录
编程日记
2024/12/22 21:24:01
基于springboot+vue+Mysql的外卖点餐系统
开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…
编程日记
2024/12/16 15:31:42
BUU-[极客大挑战 2019]Http
考察点
信息收集 http构造请求数据包
题目 解题步骤
参考文章:https://zhuanlan.zhihu.com/p/367051798 查看源代码 发现有一个a标签,但是οnclick"return false"就是点击后不会去跳转到Secret.php的页面 所以我就自己拼接url
http://no…
编程日记
2024/12/22 20:38:03
python-pytorch seq2seq+attention笔记0.5.00
python-pytorch seq2seq+attention笔记0.5.00 1. LSTM模型的数据size2. 关于LSTM的输入数据包含hn和cn时,hn和cn的size3. LSTM参数中默认batch_first4. Attention机制的三种算法5. 模型的编码器6. 模型的解码器7. 最终模型8. 数据的准备9. 遇到的问题10. 完整代码1. LSTM模型的…
编程日记
2024/12/15 15:33:33
Git系列:git merge 使用技巧
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
推荐:「stormsha的主页」…
编程日记
2024/12/11 3:29:22