Introducing DeepSeek LLM (Large Language Model), an advanced language model comprising 67 billion parameters. It has been trained from scratch on a vast dataset of 2 trillion tokens in both English and Chinese. In order to foster research, we have made DeepSeek LLM 7B/67B Base and DeepSeek LLM 7B/67B Chat open source for the research community.
1. Superior General Capabilities: DeepSeek LLM 67B Base outperforms Llama2 70B Base in areas such as reasoning, coding, math, and Chinese comprehension.
2. Proficient in Coding and Math: DeepSeek LLM 67B Chat exhibits outstanding performance in coding (HumanEval Pass@1: 73.78) and mathematics (GSM8K 0-shot: 84.1, Math 0-shot: 32.6). It also demonstrates remarkable generalization abilities, as evidenced by its exceptional score of 65 on the Hungarian National High School Exam.
3. Mastery in Chinese Language: Based on our evaluation, DeepSeek LLM 67B Chat surpasses GPT-3.5 in Chinese.
We release the DeepSeek LLM 7B/67B, including both base and chat models, to the public. To support a broader and more diverse range of research within both academic and commercial communities, we are providing access to the intermediate checkpoints of the base model from its training process. Please note that the use of this model is subject to the terms outlined in License section. Commercial usage is permitted under these terms.
https://huggingface.co/deepseek-ai/deepseek-llm-7b-base
https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat
https://huggingface.co/deepseek-ai/deepseek-llm-67b-base
https://huggingface.co/deepseek-ai/deepseek-llm-67b-chat
DeepSeek LLM (Large Language Model) là một mô hình ngôn ngữ lớn nâng cao bao gồm 67 tỷ tham số. Nó đã được đào tạo từ đầu trên một tập dữ liệu khổng lồ gồm 2 nghìn tỷ mã thông báo bằng cả tiếng Anh và tiếng Trung. Để thúc đẩy nghiên cứu, chúng tôi đã tạo ra DeepSeek LLM 7B/67B Base và DeepSeek LLM 7B/67B Chat mã nguồn mở cho cộng đồng nghiên cứu.
1. Khả năng vượt trội: DeepSeek LLM 67B Base vượt trội hơn Llama2 70B Base trong các lĩnh vực như lý luận, mã hóa, toán học và hiểu tiếng Trung.
2. Thành thạo về mã hóa và toán học: DeepSeek LLM 67B Chat thể hiện hiệu suất vượt trội trong mã hóa (HumanEval Pass@1: 73,78) và toán học (GSM8K 0-shot: 84,1, Toán 0-shot: 32,6). Nó cũng thể hiện khả năng khái quát đáng chú ý, bằng chứng là điểm số đặc biệt là 65 trong Kỳ thi trung học phổ thông quốc gia Hungary.
3. Thành thạo tiếng Trung: Dựa trên đánh giá của chúng tôi, DeepSeek LLM 67B Chat vượt qua GPT-3.5 ở tiếng Trung.
Chúng tôi phát hành DeepSeek LLM 7B/67B, bao gồm cả mô hình cơ sở và mô hình trò chuyện, cho công chúng. Để hỗ trợ phạm vi nghiên cứu rộng hơn và đa dạng hơn trong cả cộng đồng học thuật và thương mại, chúng tôi cung cấp quyền truy cập vào các điểm kiểm tra trung gian của mô hình cơ sở từ quy trình đào tạo của mô hình này. Xin lưu ý rằng việc sử dụng mô hình này phải tuân theo các điều khoản được nêu trong phần Giấy phép. Việc sử dụng thương mại được phép theo các điều khoản này.
https://huggingface.co/deepseek-ai/deepseek-llm-7b-base
https://huggingface.co/deepseek-ai/deepseek-llm-7b-chat
https://huggingface.co/deepseek-ai/deepseek-llm-67b-base
https://huggingface.co/deepseek-ai/deepseek-llm-67b-chat
Generative AI, Robot Operating System (ROS 2), Computer Vision, Natural Language Processing service, Generative AI Chatbot, Machine Learning, Mobile App, Web App? Yes, I do provide!
Call me: +84854147015
WhatsApp: +601151992689
https://amatasiam.web.app
Email: ThomasTrungVo@Gmail.Com
Facebook: https://www.facebook.com/voduytrung
X: https://x.com/ThomasTrung
No comments:
Post a Comment