HuggingFace调用本地的腾讯翻译模型hy-mt2:1.8b

strength_zhou2013

184人浏览 · 2026-07-01 14:39:25

strength_zhou2013 · 2026-07-01 14:39:25 发布

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_path = "D:\\hf_cache\\Hy-MT2-1.8B"

if __name__ == "__main__":
    # 从https://ai.gitcode.com/tencent_hunyuan/Hy-MT2-1.8B下载
    # Load tokenizer
    tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

    # Load model
    model = AutoModelForCausalLM.from_pretrained(
        model_path,
        dtype=torch.bfloat16,
        device_map="auto",
        trust_remote_code=True,
    )

    model.eval()

    # Example inference
    prompt = "将以下文本翻译成英语,注意只需要输出翻译后的结果,不要额外解释:\n\n今天天气真好。"
    messages = [{"role": "user", "content": prompt}]
    inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt").to(model.device)

    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=4096,
        )
    response = tokenizer.decode(outputs[0][inputs["input_ids"].shape[-1]:], skip_special_tokens=True)
    print(response)

亚马逊云科技技术品牌专区

更多推荐

cubesandbox线下实操体验

亚马逊云科技技术品牌专区

基于对话的问诊系统设计与实现

亚马逊云科技技术品牌专区

Go语言设计理念

以前我认为，一门优秀的语言，应该拥有越多高级特性越好。但学习 Go 后，我改变了这个看法。真正优秀的语言，不一定拥有最复杂的语法，而是能够帮助开发者写出更简单、更可靠、更容易维护的代码。简单不是能力不足，而是一种经过深思熟虑后的克制。对于个人开发来说，Go 提高了开发效率；对于团队协作来说，它降低了沟通成本；对于大型项目来说，它保证了长期维护的可持续性。或许，这正是 Go 能够在云计算、微服务和现