AI時代的網站與手機App建置與開發Part30 - ML 4.0新功能介紹
l 摘要
Microsoft在2025年的1月16日發佈了新版本的ML.NET 4.0, 這個新版本主要的功能在於加入了整合GPT-4的Token解析功能, 支援.NET應用程式與GPT-4大型語言模型的協同合作. Microsoft在ML.NET的支援不斷地在提升, 按照Microsoft的研發時程, 在2025年底還會有更新的ML.NET 5.0與大家見面.
圖: 機器學習示意圖
l 認識ML.NET 4.0
ML.NET 4.0是Microsoft支援,NET工程師開發機器學習相關的應用的最新版本開放原始碼程式庫, 是繼2023年11月底發佈的ML.NET 3.0之後的最新版本, 其主要的功能更新包括更強大的分詞(Tokenization)功能, 新版本的Model Builder Visual Studio延伸模組, 整合TorchSharp程式庫, 以及功能更先進的AutoML功能.
1. 更強大的分詞(Tokenization)功能
ML.NET 4.0支援的 Microsoft.ML.Tokenizers程式庫增強了以下的幾項功能:
- 功能更強大的應用程式介面與Tiktoken分詞支援:
- Llama 大型語言模型的分詞支援:
- CodeGen分詞支援:
- Span-based應用程式介面與Flexible Normalization支援:
因為上述這些功能的強化, ML.NET 4.0較之前的版本更能夠簡化, 或是提升各種自然語言處理的功能的效率.
2. 新版本的Model Builder Visual Studio延伸模組
新版本的Model Builder Visual Studio延伸模組 支援.NET工程師能夠透過Visual Studio直接使用ML.NET提供的question answering (QA)功能與named entity recognition (NER)功能.
3. 整合TorchSharp程式庫
ML.NET 4.0支援整合TorchSharp程式庫(支援.NET應用程式叫用PyTorch機器學習程式庫的功能), 建立基於PyTorch程式庫的深度學習功能, 例如物件偵測, named entity recognition (NER), 以及question answering(QA)等常用的功能.
4. 功能更先進的AutoML功能
ML.NET 4.0支援的AutoML(Automated Machine Learning)功能加入了尋找相似語句, question answering(QA), 物件偵測, 以及最佳模型選擇與最佳超參數(hyperparameter)選擇等功能.
透過ML.NET
4.0的幫助, .NET工程師能夠更有效率地使用Visual Studio程式開發工具發展以.NET平台為基礎的機器學習相關應用.

留言
張貼留言