
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习不同于监督学习,在一些任务中数据标注困难,但机器可通过环境反馈知道结果好坏。强化学习是机器学习的一部分,可定义为寻找一个策略(函数),使智能体(Actor)在给定观察(Observation)时能选择最佳行动(Action),以最大化总奖励(Reward)。例如在玩太空侵略者游戏或围棋时,智能体根据游戏状态(观察)采取行动,如移动、射击(太空侵略者)或落子(围棋),游戏结束时根据结果获得奖

Introduction to Generative AI 2024 Spring该文档主要介绍了国立台湾大学(NTU)2024 年春季 “生成式人工智能(GenAI)” 课程的作业 5(GenAI HW5)相关内容,包括任务概述、待办事项、解码参数、提交与评分、参考资料和附录等部分,具体如下:根据作业的规范要求,这是TA 助教提供的代码连接 需要魔法 google 账号 colab 账号执行Ge

资料来自台湾大学李宏毅教授机器学课程ML 2023 Spring,如有侵权请通知下架台大机器学课程ML 2023 Spring2023/3/10 课程 機器如何生成文句。

机器学习框架:包含训练数据和测试数据,可应用于语音识别、图像识别、说话人识别、机器翻译等任务。过拟合现象:训练数据上损失小,测试数据上损失大。可能出现模型偏差(model bias)或优化问题(optimization issue)。介绍了交叉验证的概念,包括一般交叉验证和 N - fold 交叉验证。强调不推荐使用公共测试数据结果来选择模型,因为这可能会导致公共集表现优于私人集的问题。通过示例展

Fine-tuning技术的出现,让大模型的应用门槛大大降低。无论是个人开发者还是企业用户,都可以通过这项技术快速构建专业领域的AI助手。随着技术的不断发展,我们有理由相信,未来的AI将更加个性化、专业化,真正成为我们工作和生活中的得力助手!赶紧试试Fine-tuning实操吧,让你的大模型从此脱胎换骨!本文由AI技术博主原创,转载请注明出处。关注我,带你解锁更多AI神器!

LoRA(Low-Rank Adaptation)微调是近年来在大模型领域掀起的一场革命!想象一下,你要训练一个70亿参数的大模型,传统方法需要数千万元的算力成本,而LoRA只需要更新其中1-10%的参数,成本瞬间降低10倍!LoRA微调技术的出现,让大模型的应用门槛大大降低。无论是个人开发者还是企业用户,都可以通过这项技术快速构建专业领域的AI助手。随着技术的不断发展,我们有理由相信,未来的AI

Coze平台的出现,让AI应用开发变得前所未有的简单。无论是企业用户还是个人开发者,都可以通过这个平台快速构建出功能强大的AI智能体。随着技术的不断发展,我们有理由相信,未来的AI应用开发将更加民主化,每个人都能成为AI应用的创造者!赶紧试试Coze平台吧,让你的创意快速变成现实!本文由AI技术博主原创,转载请注明出处。关注我,带你解锁更多AI神器!t=P9T8。

RAGFlow本地部署方案:基于DeepSeek-R1构建私有知识库问答系统 该方案通过本地化部署解决了网页版AI服务的三大痛点:数据隐私风险、文件上传限制和使用繁琐性。核心采用RAG(检索增强生成)技术,结合Embedding模型实现语义检索,使大模型能准确回答专业领域问题(如台湾民法)。实施步骤包括:1)通过Ollama部署本地DeepSeek-R1模型;2)Docker运行RAGFlow框架
高准确率:基于大规模预训练模型,识别准确率超过95%多语言支持:支持中、日、法、德、韩等多种语言易集成:通过API方式调用,轻松集成到现有系统高效率:秒级处理,大幅提升业务效率低成本:相比人工审核,成本降低80%以上视觉大模型在寿险行业的应用,标志着保险行业正式迈入智能化时代。通过这项技术,我们不仅能够大幅提升业务效率,降低运营成本,更重要的是能够为客户提供更好的服务体验。未来,随着技术的不断发展

统一抽象:优雅的多提供商统一接口设计智能适配:针对不同提供商的特性优化错误恢复:完善的重试、修复和兜底机制性能优化:异步处理、连接池、缓存等优化策略监控调试:详细的日志记录和性能监控扩展性:易于添加新提供商和新功能企业特性:余额查询、嵌入服务等企业级功能对于构建企业级 RAG 系统,这个 API 处理架构提供了完整的参考实现。通过合理的设计和优化,可以在保证服务质量的同时,实现高可用、高性能、低成







