月度归档: 2025 年 10 月

3 篇文章

thumbnail
RAG
全程:Retrival Augmented Generation,检索增强生成。作用主要是:从资料库中检索内容,然后基于这些内容生成答案。解决问题:无法读取全部,上下文有限。 分片:字数,内容,段落,章节之类的。切分成多份 索引: 通过Embedding把片段转换为文本向量 Embedding模型,做专门的向量转化 向量数据库:Embedding后…
thumbnail
一步Windows永久激活
主机在重新装Windows之后,也提示我需要重新激活了。本来是打算闲鱼买个激活码得了,结果听鲲鲲说有这个MAS,试用了一下还真不错 操作步骤 右键点击 Windows 开始菜单,以管理员身份运行 Windows PowerShell(注意不是 CMD)。 输入下面的代码并回车: irm https://get.activated.win | iex…
thumbnail
Prompt Compression论文阅读
双压缩 LongCodeZip: Compress Long Context for Code Language Models 问题:虽然LLM很强大,但LLM压缩推理时候如果上下文过长,需要一定限制,不然导致信息丢失,性能下降。 传统的一些解决思路: LLMLingua:用小的transformor模型,对原始prompt 或上下文,语义保留的重…