logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

IMPALA强化学习算法的学习和解读

IMPALA是DeepMind于2018年提出的可扩展分布式深度强化学习架构。全名Importance Weighted Actor-Learner Architecture,让单个智能体能同时学习多个任务。IMPALA采用分离式Actor-Learner架构和V-trace off-policy,通过高效分布式计算提升训练速度。这里深入分析探索IMPALA的Actor-Learner架构和V-T

#算法#学习
开源世界模型的探索和调研

JEPA用于构建用于物理世界的推理型世界模型JEPA是杨立昆提出的AI架构,联合嵌入预测架构(Joint Embedding Predictive Architecture)。JEPA不直接在像素或词(token)空间进行预测和生成,在更高层、抽象潜在表示空间中进行预测。JEPA包含两个主要部分:Encoder和Predictor,Encoder负责将输入数据,比如一段视频的两帧图像,分别映射到两

#人工智能
如何在jupyter中使用typescript基于plotly.js画图

plotly.js是JavaScript图表库,可以创建交互式和响应式的数据可视化图表。plotly.js支持各种图表类型,折线图、散点图、柱状图、饼图等,可与TypeScript无缝集成。这里尝试在typescript环境中基于plotly.js画图。所用示例参考和修改自网络资料。

#信息可视化
大模型语义分块策略探索

LLM上下文窗口有限,不能容纳所有信息,所以有必要对LLM处理信息进行分块。这里以Semantic Chunks的StatisticalChunker为例,探索大模型语义分块策略,参考链接如下。这个语义分块过程不是一步完成,而是先使用标点符号、长度等基本信息进行初步语义分块。然后,基于分块之间相似度,对语义接近的多个相邻分块进行融合,确保分块语义的完整性。

#c##开发语言
mac测试ollama llamaindex

在一次重要的政务活动中,他被圣人指派为荔枝使,负责运输珍贵的荔枝,这一职位对他来说具有极大的意义。他的经历展现了他在官场中的沉稳与担当,也体现了他在复杂的政治环境中所展现出的智慧与忠诚。以pdf文件"长安的荔枝- 马伯庸.pdf"为例(可以替换为其他PDF书籍),通过llama_index读取为documents,为减少计算量,取前10个子document。可见,llamaindex,借助外部知识

#人工智能#数据仓库
基于deepseek的文本解析 - 超长文本的md结构化

然而,不管是langchain还是llamaindex提供的文本分割工具,很难直接对非结构化文本进行准确的语义分割,很多原来连续的内容都被分割在不同块中。deepseek完成本次解析后,将deepseek解析生成的结构化md作为already_parsed输入,将下次待解析非结构化的若干页文档作为waiting_parsed输入。这里尝试基于deepseek,将pdf解析后的非结构化文本转化为结构

#人工智能#nlp
内容索引之word转md工具 - markitdown

目前效果较好的word转md工具,要么是需要付费的商业版,要么借助于LLM转化,而LLM调用同样需要付费。微软开发的word转md的开源工具markitdown,也可以达到类似效果,并且不用花钱。切分文档构建RAG库过程中,langchain、llamaindex更期望处理latex、md类带有显式结构文档。langchain、llamaindex切分word,有可能将段落中间截断,导致切分后的块

#人工智能#数据分析
基于GraphRAG+Ollama验证知识图谱和检索增强融合

之前介绍了知识图谱与检索增强的融合探索GraphRAG这里尝试在CPU环境,基于GraphRAG+Ollama,验证GraphRAG构建知识图谱和查询过程。

#知识图谱#人工智能#数据分析
LLM做逻辑推理题 - 为什么小张是A队的

因此,无论小张选择问的是哪个队的人,只要他报告对方说西边,那么只有当他属于A队时才会这样,而如果是B队的话,他必须撒谎对方的回答,所以对方的真实回答要么是西边(如果问的是A队的人),此时小张撒谎会变成东边;如果小张问的是B队的人,B队的人会说假话,由于他们实际在东边,但他们会撒谎说自己不在东边,所以他们会回答西边,所以不管小张问的是A队还是B队的人,只要小张自己是A队的,他都会如实报告对方说西边,

#人工智能
从蒙特卡洛的角度探索和示例重要性采样

重要性采样是RL强化学习,特别是调优LLM的PPO等的理论基础。这里从蒙特卡洛的角度,尝试分析和探索重要性采样,重要分布,以及重要权重的核心要素。所用到的图标、数据参考和修改自网络资料。

#机器学习#算法#人工智能
    共 202 条
  • 1
  • 2
  • 3
  • 21
  • 请选择