中評社北京4月15日電/據科技日報報導,從快速生成邏輯清晰的長篇文章,到無需視頻素材即可生產視頻片段,大模型近期發展迅速。
除了聊天機器人、文生圖、編寫代碼等應用之外,大模型如何進一步與行業緊密結合,怎樣更具行業黏性,仍是業界需要探討的問題。
“大模型將為各行各業賦能已經成為共識,但在具體實踐中如何把大模型與行業、企業的具體業務結合,仍需不斷探索。”在近日召開的亞馬遜雲科技生成式AI媒體溝通會上,亞馬遜雲科技大中華區產品部總經理陳曉建認為,場景千變萬化,各行各業要將大模型強大的技術能力運用好,需要企業有一系列周邊能力來正確、合理、安全、高效地使用大模型。
要獲得能夠落地各行各業的大模型,首先要有強大的基礎模型,之後再結合場景開展與業務結合的相關訓練。為此,亞馬遜雲科技與美國人工智能企業Anthropic開展合作,對Claude 3系列模型進行訓練。當前,該模型在複雜任務中表現出優秀的理解能力。
但僅有基礎模型還遠遠不夠。雖然大模型能力非常強,但其應用場景和任務千變萬化。使用大模型前必須要有定制化調優。如果簡單地將基礎大模型“拿來”使用,就難以達到最優效果。
訓練模型是增加大模型行業黏性的必由之路。“選擇應用場景訓練大模型時,訓練端需要一個有足夠擴展能力的規模集群。”亞馬遜雲科技大中華區數據分析與生成式AI產品總監崔瑋建議,進行行業大模型訓練時需要可靠、安全且彈性足夠強的環境,訓練之後需要在雲端為大模型運算提供足夠算力服務等。
在行業大模型落地過程中,人才團隊的保障也至關重要。陳曉建表示,即使具備完善的數據基礎、進行了很好的行業訓練,行業大模型仍無法滿足行業所有需求。這就需要專業團隊開展業務支持,比如方案架構師與業務人員共同尋找應用場景和解決方案,產品技術專家結合特定需求微調大模型輸出模式等。
(來源:科技日報) |