logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pycharm + deepseek 实现curse功能

点击左侧“API Keys”,点击创建 API key,输出名称为“AI 代码提示”,也可以使用其它自定义的名称。插件安装成功后,在右侧的标签栏中,会显示一个Continue的标签,我们点击即可进入,随后点击设置按键,如下图。点击“创建",一定要记录此处的 API key,可以先将 API key 复制在其它地方。打开PyCharm,打开文件->设置->插件,搜索“Continue”,点击安装。随

文章图片
#pycharm#数据库#redis
深度强化学习之123-概念梳理

摘要: 马尔可夫决策过程(MDP)是强化学习的核心数学模型,由五元组(状态空间、动作空间、状态转移概率、奖励函数、折扣因子)构成。MDP描述智能体在环境中通过策略π选择动作,产生轨迹并获得奖励的过程,其随机性体现在环境转移、策略选择和奖励噪声上。强化学习的目标是找到最优策略π*,最大化长期折扣回报,通过价值函数(V函数和Q函数)评估状态和动作的优劣。最终,MDP为强化学习提供了形式化框架,帮助智能

文章图片
#人工智能
Pandas数据清洗实例(拆列,列计算,列值成行)

学习python 有一段时间了,一直徘徊与基础,最近接了一个解析数据的任务,算是学习以来第一次实战,故而作此记录。问题解析:为了节省数据存储空间,信息以字符串存在了一个单元格中,我们需要的是时间的首尾值,最后要做差计算,使用BI 软件(spotifire)进行页面展示。原始数据如图1.第一步要解决的问题是时间转换问题因为数据中step_times是long格式(timestamp类似,l...

幻觉终结者:OpenAI 终于找到了根本原因

核心在于:让模型**敢于说“不知道”**比“瞎猜”更值钱。最近,OpenAI 正式揭开了大型语言模型(LLM)“幻觉”现象的真面目:原来问题不在于模型太“聪明”,而是它们的训练奖励机制本身,促使它们“自信满满地说错话”,却不愿诚实承认不知道。模型缺乏判断生成内容真伪的能力,特别是面对极少出现的单次事实,其错误可能率媲美其出现概率;设定规则:只有当模型置信度 > 某一阈值才作答,答错扣分,“我不知道

文章图片
#人工智能
幻觉终结者:OpenAI 终于找到了根本原因

核心在于:让模型**敢于说“不知道”**比“瞎猜”更值钱。最近,OpenAI 正式揭开了大型语言模型(LLM)“幻觉”现象的真面目:原来问题不在于模型太“聪明”,而是它们的训练奖励机制本身,促使它们“自信满满地说错话”,却不愿诚实承认不知道。模型缺乏判断生成内容真伪的能力,特别是面对极少出现的单次事实,其错误可能率媲美其出现概率;设定规则:只有当模型置信度 > 某一阈值才作答,答错扣分,“我不知道

文章图片
#人工智能
python读取图片并且转码成base64

import base64with open("grayimage.png", "rb") as img_file:#对于图片而言read读取的结果是bytesb64_string = base64.b64encode(img_file.read())return b64_string.decode("utf-8")# decode is used for removing b’ from the

#python
调参神器optuna学习笔记

介绍optuna作为调参工具适合绝大多数的机器学习框架,sklearn,xgb,lgb,pytorch等。主要的调参原理如下:1 采样算法利用 suggested 参数值和评估的目标值的记录,采样器基本上不断缩小搜索空间,直到找到一个最佳的搜索空间,其产生的参数会带来 更好的目标函数值。optuna.samplers.TPESampler 实现的 Tree-structured Parzen Es

文章图片
#机器学习#人工智能
pycharm + deepseek 实现curse功能

点击左侧“API Keys”,点击创建 API key,输出名称为“AI 代码提示”,也可以使用其它自定义的名称。插件安装成功后,在右侧的标签栏中,会显示一个Continue的标签,我们点击即可进入,随后点击设置按键,如下图。点击“创建",一定要记录此处的 API key,可以先将 API key 复制在其它地方。打开PyCharm,打开文件->设置->插件,搜索“Continue”,点击安装。随

文章图片
#pycharm#数据库#redis
到底了