大模型通常指的是深度學習中具有大量參數和計算資源需求的神經網絡模型,以下是目前較爲知名的大模型:
GPT-4:OpenAI推出的AI大模型,展示了包括複雜的推理、高級編碼、多種學術學習等能力,是第一個可以同時接受文本和圖像作爲輸入的多模態模型。
PaLM 2:谷歌推出的大型語言模型,專注於常識推理、形式邏輯、數學和多語言的高級編碼。
BERT:Google開發的語言模型,廣泛應用於自然語言處理任務。
ResNet:微軟研究院提出的深度卷積神經網絡模型,用於圖像分類和目標檢測等任務。
此外,還有百度“文心一言”、阿里巴巴“通義千問”、華爲“盤古”、科大訊飛“星火”等國內科技公司推出的大模型,以及針對金融、汽車、醫療等垂直領域開發的大模型,如微軟的BioGPT-Large模型等。