liliangcsdn 个人主页

@liliang199

liliangcsdn

2022-07-08 16:52:28 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

代码生成模型评价指标pass@k评估优化

代码生成模型正确性不在于与参考答案的相似度，而在于能否通过预定义测试用例，因此BLEU、ROUGH等指标表现不佳。pass@k是用于程序代码生成任务的评价指标，在自动编程的评估中非常有用。之前探索了直接统计通过测试的问题数的pass@k指标评估方法。然后，存在方差容易较大的问题。OpenAI结合组合数学的抽取小球的方法对评估过程进行优化。这里尝试探索优化过程，并通过程序进行示例。

#人工智能 #算法

LLM大模型Token用量统计计算

token 是模型用来表示自然语言文本的基本单位，可以直观的理解为“字”或“词”。通常 1 个中文词语、1 个英文单词、1 个数字或 1 个符号计为 1 个 token。一般情况下模型中 token 和字数的换算比例大致如下：1 个英文字符 ≈ 0.3 个 token。1 个中文字符 ≈ 0.6 个 token。不同模型的分词不同，换算比例也存在差异。这里示例集中token计算方式。

#人工智能

RAG向量相似度、距离计算方法探索和示例

相似度是ml类应用经常用到的计算，这里示例python中经常用到的一些相似度计算方法。

#python #人工智能 #机器学习

langchain llm如何支持工具类应用的自定义结构化抽取

这里示例通过自定义parser的方式，解决上述的抽取失败的问题。针对2.2小节抽取失败案例，通过PydanticOutputParser自定义parser方式，实现结构化信息抽取。核心逻辑如下所示：1) 通过PydanticOutputParser自定义parser，识别GuardrailsOutput中需要抽取的内容。2）system_prompt中增加如下明确提示目的是提示llm在输出内容时，

大模型自定义结构化输出示例

不是所有模型都实现了with_structured_output函数，不一定都支持工具调用或json方式。这里尝试采用自定义的方式，实现这些模型的结构化输出。

#java #开发语言

大模型自定义结构化输出示例

不是所有模型都实现了with_structured_output函数，不一定都支持工具调用或json方式。这里尝试采用自定义的方式，实现这些模型的结构化输出。

#java #开发语言

langgraph基于ReACT集成langchain定义的功能

首先定义知识图谱、大模型，以及action状态数据结构，后者用于粘合langchain定义各功能模块。大模型应用deepseek-r1，具备强大的处理能力。import os基于之前探索内容，这里罗列langchain定义的generate_cypher、validate_cypher、correct_cypher、execute_cypher、generate_final_answer等多个模块

langgraph基于ReACT集成langchain定义的功能

langchain如何检查llm生成cypher的正确性并修正错误

之前介绍了langchain如何依赖prompt判断neo4j图谱能否回答用户问题。这里通过多种手段分析llm生成cypher的正确性，并尝试基于llm修正错误和重写cypher。

langchain如何判断neo4j知识图谱是否能回答问题

由于neo4j图谱局限性，图谱不能回答所有问题，如电影图谱，可能回答不了天气、经济类问题。另外图谱自身并不能判断否则回答问题，这里尝试基于langchain判断图谱能否回答问题。实验所用代码参考和修改自网络资料。

共 96 条

请选择