AI時代的網站與手機App建置與開發Part30 - ML 4.0新功能介紹

 l  摘要

Microsoft2025年的116日發佈了新版本的ML.NET 4.0, 這個新版本主要的功能在於加入了整合GPT-4Token解析功能, 支援.NET應用程式與GPT-4大型語言模型的協同合作. MicrosoftML.NET的支援不斷地在提升, 按照Microsoft的研發時程, 2025年底還會有更新的ML.NET 5.0與大家見面.

: 機器學習示意圖

l  認識ML.NET 4.0

ML.NET 4.0Microsoft支援,NET工程師開發機器學習相關的應用的最新版本開放原始碼程式庫, 是繼202311月底發佈的ML.NET 3.0之後的最新版本, 其主要的功能更新包括更強大的分詞(Tokenization)功能, 新版本的Model Builder Visual Studio延伸模組, 整合TorchSharp程式庫, 以及功能更先進的AutoML功能.

1.    更強大的分詞(Tokenization)功能

ML.NET 4.0支援的 Microsoft.ML.Tokenizers程式庫增強了以下的幾項功能:

  • 功能更強大的應用程式介面與Tiktoken分詞支援
          Tiktoken分詞技術是OpenAI 的機器學習模型使用的分詞技術, 支援Tiktoken分詞技術方  
          便.NET應用程式直接整合包括GPT-4在內的GPT機器學習模型.

  • Llama 大型語言模型的分詞支援
          支援包括LLaMAMistral在內, Llama為基礎的機器學習模型的分詞技術, 在支援自然語
           言處理方面提供更多的選擇

  • CodeGen分詞支援
          支援codegen-350M-monophi-2使用的分詞技術, 提供更強大的程式碼寫作協助與程式碼
          搜尋解決方案.

  • Span-based應用程式介面與Flexible Normalization支援
           Span-based 應用程式介面支援操作文件中一系列的字詞(Token), 稱為Span, 達到取出關鍵
           字詞, 修改關鍵字詞, 或是分析關鍵字詞的目的. Flexible normalization支援處理文字內容的
           各種表示方法(例如大小寫不同, 口音不同, 英文時態, 以及標點符號不同), 不受文字的各種
           表示方式的不同, 而仍然能夠達到正確的自然語言處理.

因為上述這些功能的強化, ML.NET 4.0較之前的版本更能夠簡化, 或是提升各種自然語言處理的功能的效率.

2.    新版本的Model Builder Visual Studio延伸模組

新版本的Model Builder Visual Studio延伸模組 支援.NET工程師能夠透過Visual Studio直接使用ML.NET提供的question answering (QA)功能與named entity recognition (NER)功能.

3.    整合TorchSharp程式庫

ML.NET 4.0支援整合TorchSharp程式庫(支援.NET應用程式叫用PyTorch機器學習程式庫的功能), 建立基於PyTorch程式庫的深度學習功能, 例如物件偵測, named entity recognition (NER), 以及question answering(QA)等常用的功能.

4.    功能更先進的AutoML功能

ML.NET 4.0支援的AutoML(Automated Machine Learning)功能加入了尋找相似語句, question answering(QA), 物件偵測, 以及最佳模型選擇與最佳超參數(hyperparameter)選擇等功能.

透過ML.NET 4.0的幫助, .NET工程師能夠更有效率地使用Visual Studio程式開發工具發展以.NET平台為基礎的機器學習相關應用.

留言

這個網誌中的熱門文章

AI時代的網站與手機App建置與開發Part29 - 使用YOLO模型偵測影片中的物件

AI時代的網站與手機App建置與開發Part27 - ML.NET與物件偵測