Octal's Tiny Home🍭

发表于2026-01-14|更新于2026-01-14|base-llm学习笔记

📚 学习资源致谢本学习笔记主要参考自 DataWhale Base-LLM 教程——一份由datawhale社区精心打磨的开源教材，涵盖大模型基础理论与实践应用。特此鸣谢！ 📖 第一节 Seq2Seq 架构 1. 为什么需要 Seq2Seq？传统的 RNN/LSTM 处理序列有局限性：对齐限制：Many-to-Many（等长）要求输入输出一一对应。现实痛点：翻译、摘要任务中，输入 XXX 和输出 YYY 的长度通常不相等（Unaligned）。核心逻辑：Seq2Seq 引入了“中间人”机制，将信息理解（Encoder）与信息生成（Decoder）彻底解耦。 2. 架构拆解：双螺旋结构 A. Encoder (压缩信息) 任务：将变长序列 XXX 映射为定长向量 CCC（Context Vector）。关键点：CCC 通常是 RNN 最后一个时间步的隐状态（Hidden State）。思考：为什么常用双向 RNN？因为编码时可以“开天眼”看到全文，双向捕捉到的语义比单向更扎实。 B. Decoder (条件生成) 本质：一个条件语言模型P(yt ...

[书生大模型]论文分类微调打榜赛二等奖-比赛方案分享

发表于2025-08-14|更新于2025-08-14|LLM

比赛背景该比赛算是“书生大模型实战营-第五期”的沐曦魔乐专场。比赛任务就是在沐曦算力下微调InternLM-1.5B进行论文分类，由沐曦和魔乐社区提供赞助和平台支持，要求呢就是必须得用沐曦的算力来微调。笔者最终比赛成绩为83.36，在比赛结束后特将比赛方案分享于此。创建沐曦算力容器及配置环境本任务使用D.run平台提供的沐曦算力完成，大部分时间白嫖了32G的，高峰期则使用了香港一区的64G。 https://console.d.run/zestu/market?regionId=sh-06 选择Pytorch镜像安装 ms-swift 123conda create -n ms-swift python=3.10 -yconda activate ms-swiftpip install ms-swift -U 中途服务器镜像更新过一次，最新版的镜像可能需要先 pip uninstall flash_attn 再执行以下命令，不然会有版本问题。 (PS：本文具有时效性，不确保该方案会适用于D.run未来更新后的镜像) 然后安装mx编译后的包创建req ...

[Datawhale AI夏令营] 语音克隆比赛方案

发表于2025-08-12|更新于2025-08-14|AIGC

2025年Datawhale AI夏令营AIGC语音方向学习笔记 & 2025全球AI攻防挑战赛-赛道三比赛方案赛事链接： https://tianchi.aliyun.com/competition/entrance/532393/introduction 本次更新是笔者的成绩在82.16。由于比赛仍在进行中，这里公开一部分基础方案，完整比赛方案将于比赛结束后更新。 F5-TTS方案 (baseline) 安装环境 12pip install f5-ttsexport HF_ENDPOINT=https://hf-mirror.com 测试一下是否安装成功 1f5-tts_infer-cli --model F5TTS_v1_Base --ref_audio "./aigc_speech_generation_tasks/reference_1.wav" --gen_text "六" 运行生成脚本 12345678910111213141516171819import shutilimport os, sysimport ...

ACM常用库函数系列：lower_bound/upper_bound

发表于2025-04-03|更新于2025-04-03|算法随笔

在C++中，lower_bound和upper_bound是用于在有序序列中高效查找元素的函数，位于头文件。它们的时间复杂度为O(log n)（要求随机访问迭代器）。一般来说，这两个函数能实现的功能，使用二分法都能实现；不过为了编码速度和代码的简洁性，在程序的某个环节如果需要一个简单二分查找了，我们往往还是使用这两个函数来查找。功能简要说明 lower_bound：返回第一个不小于value的元素的位置。 upper_bound：返回第一个大于value的元素的位置。函数原型 123456789101112template< class ForwardIt, class T >ForwardIt lower_bound( ForwardIt first, ForwardIt last, const T& value );template< class ForwardIt, class T >ForwardIt upper_bound( ForwardIt first, ForwardIt last, const T& value );/ ...

nndl学习笔记第一章：绪论

发表于2025-03-26|更新于2025-08-12|深度学习

课程主页：https://nndl.github.io/ 第一章绪论神经网络：一种以（人工）神经元为基本单元的模型。深度学习：一类机器学习问题，主要解决负献度分配问题。 1.1 本书的知识体系 1.2 人工智能人工智能的诞生 1956 年的达特茅斯（Dartmouth）会议：在这次会议上，“人工智能”被提出并作为本研究领域的名称．同时，人工智能研究的使命也得以确定．John McCarthy提出了人工智能的定义：人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样．目前，人工智能的主要领域大体上可以分为以下几个方面：（1）感知：模拟人的感知能力，对外部刺激信息（视觉和语音等）进行感知和加工．主要研究领域包括语音信息处理和计算机视觉等．（2）学习：模拟人的学习能力，主要研究如何从样例或从与环境的交互中进行学习．主要研究领域包括监督学习、无监督学习和强化学习等．（3）认知：模拟人的认知能力，主要研究领域包括知识表示、自然语言理解、推理、规划、决策等．人工智能的发展历史人工智能从诞生至今，经历了一次又一次的繁荣与低谷， ...

Windows中PDF, TXT, Excel, Word, PPT等文件在预览窗口无法预览的解决办法(全)

发表于2025-03-01|更新于2025-03-01|杂谈

系统环境：Windows11 🤝 参考文章：https://blog.csdn.net/qq_58094000/article/details/144906747 ⚠️注意：以上方法均会对注册表进行修改，一定要先备份整个注册表，以防万一，避免导致系统错误❗ 情况一：显示没有预览打开文件资源管理器-文件-查看-预览窗格在文件资源管理器的右边就会显示预览窗格，此时发现Word 、Excel、 PPT等Office文件是无法正常预览的，显示没有预览。方法：手动修改注册表 1.准备工作：先将所有Office相关的文件类型默认应用改为Office（之前可能被wps改为了使用wps打开），打开设置-应用-默认应用-按文件类型指定默认应用。若预览还是不能正常显示，直接进行步骤2. 2.修改与Office文件预览相关的注册表 2个项目的值，Office文件修改注册表的方式差不多，我们就以Word文件Docx为例。 (1) 使用快捷键 Windows +R 运行，然后输入 “regedit” 命令，打开注册表编辑器 (2) 找到这一项： 1计算机\HKEY_LOCAL_MACHI ...

【手册】NLP词性标注对照表

发表于2025-02-26|更新于2025-02-26|自然语言处理

jieba词性对照表（北大词性标注集）标签含义标签含义标签含义标签含义 a 形容词 ad 副形词 ag 形容词性语素 an 名形词 b 区别词 c 连词 d 副词 df e 叹词 f 方位词 g 语素 h 前接成分 i 成语 j 简称略称 k 后接成分 l 习用语 m 数词 mg mq 数量词 n 名词 ng 名词性语素 nr 人名 nrfg nrt ns 地名 nt 机构团体名 nz 其他专名 o 拟声词 p 介词 q 量词 r 代词 rg 代词性语素 rr 人称代词 rz 指示代词 s 处所词 t 时间词 tg 时语素 u 助词 ud 结构助词得 ug 时态助词 uj 结构助词的 ul 时态助词了 uv 结构助词地 uz 时态助词着 v 动词 vd 副动词 vg 动词性语素 vi 不及物动词 vn 名动词 vq x 非语素词 y 语气词 z 状态词 zg eng 英文 LTP词性对照表（863词性标注集） Tag Description Example Tag ...

2024年云南大学迎新杯程序设计大赛の题解

发表于2024-12-06|更新于2024-12-06|算法题解

前言本场比赛出题周期里，由于在备赛冲击奖牌，就把这场第二届迎新杯的出题工作基本全交给校队未来的栋梁们了。整个出题过程中，几位学弟们认真负责的态度让我非常放心，事实证明也确实带来了一套不错的题👍从去年叱咤赛场的选手身份转变为尽职尽责的出题人，他们做得很棒！这场出题人比去年还是很善良的（），赛前不断地在降难度。（而且原本Lihg给的两个疑似蓝题+紫题都被ban了最难的应该算是天际线那道题，思维上有一定的门槛，但也不难想。我勉强算出了这一道题，目的就是想给赛有余力oier们强调一下STL的重要性。应该说，善良的出题人这回是没有防AK的，其实都是可做题。非要细分的话，我赛前预估大概4 3 2的梯度（4签到+3简单+2中等，octal的个人看法）题号预估难度知识点 FirstBlood A 1 ★ 简单数学、容斥原理ェメ B 2 ★ 二分、数学 clhdlg C 2 ★ DP动态规划 Ovine D 3 ★ 贪心、优先队列 / E 2 ★ 贪心ェメ F 1 ★ 思维题翊， G 1 ★ 贪心、简单模拟翊， H 1 ★（签到题） ...

《数据库设计与开发》阅读笔记

发表于2024-10-14|更新于2025-08-12|数据库笔记

$chp1 数据库在电子商务中的角色本书的组织第2章到第5章讨论数据库设计。但是，在深入数据库设计之前，有必要了解数据库的开发环境和关系数据库设计的一些理论知识。第2章介绍数据库环境，定义了一些重要的术语并概括论述了关系数据库理论。我们可将数据库设计分为两大类，概念设计和逻辑设计。当进行概念设计时，您不必考虑前面提到的关系数据库的规则。概念设计的实现是自由的，这意味着实现的精确意义是无关紧要的。在概念设计期间您所要考虑的仅仅是数据库必须存储数据的实体，必须存储什么数据，以及实体之间是如何相互关联的。第3章和第5章介绍的是概念设计。第4章讨论的重要主题是规范化，它是用来确保数据库的设计符合关系规则。违背这些规则会导致数据的不一致。介绍数据库实现和使用的章节是成对出现的，这是根据实现数据库设计所使用的数据库管理系统组织的。第6章讨论如何用 Oracle创建数据库表。第6章还包括对 Oracle 表中数据的插入、删除和更新。第7章描述如何用 Oracle版本的结构查询语言（structured querylanguage，SQL）从数据库中检索数 ...

数据库设计——系统边界图

发表于2024-10-14|更新于2024-10-14|数据库笔记

系统边界的定义系统边界，即系统包含的功能与系统不包含的功能之间的界限。一般在系统分析阶段定义，只有明确了系统边界，才能继续进行下面的分析、设计等工作。不论这个系统是产品还是项目。所谓边界，也就是将这个系统看成一个黑盒子，和外界的交互。 “这，是一个黑色的立方体，长45厘米，宽23厘米，高3厘米，盒子的每个角都不尖锐，上方平坦，并有柔软质感；下方在四角之处都有凹进去的螺丝口，可以接杆子，以作凳子用。” 不清楚系统边界的后果：一是没有内外的概念，不知道需求描述的是什么；二是知道内外，然而对于边界的定义，没有足够的词语描述清楚，只能用对系统内部设计来代替。系统边界的确定先说说系统边界的确定。这是在工程开发中紧接着需求分析的第二步。顾名思意，这个过程就是要确定我们要开发的系统和外部环境之间的界限，也就是要区分系统本身和它的外部环境。其中的外部环境可能包括用户,其它系统,软硬件条件等。举个例子，一个银行系统，它的系统边界如何确定呢？首先，银行系统的外部活动者有储户,前台出纳员,银行管理员,这些都不属于银行系统本身，他们是此系统的外部环境；其次，银行系统是运行在操作系统上 ...