SingLing Lee


Research Interests


Approximation Algorithm / Optical Computing / Mobile Computing / Machine learning

個人研究的主要興趣是在演算法設計及分析,而在過去五年來最主要的研究工作是分別從(1)Approximation Algorithm (2) Optical computing (3)Mobile computing (4) Machine learning等四個研究主題上尋找及定義和計算相關的新問題,希望能利用既有的理論分析為基礎的方式,進行上述三個領域中的一些重要問題研究,茲將過去五年來的一些研究成果分述如下。

Approximation Algorithm

近年來此領域的研究有許多新的研究成果出來,其中在LP rounding的想法上有許多突破,尤其是在資訊領域目前能得出最佳解的快速演算法 (in P),已經被解的差不多了。如何在剩下的NP-Complete問題得出快而好的Approximation Algorithms日漸受到重視,利用LP-Relaxation再將原LP做rounding,在目前的許多研究中,都得出好的Approximation algorithm,所以在此方面的研究近年來十分活躍。我們在最近提出的結果,即對LP-rounding提出了一個新的研究趨勢,此方法是將問題難的部份用LP做rounding,而簡單部份則直接設計最佳解演算法,再將此二部份的結果合而為一,得出一個較目前為止最好的解答:1.5 Approximation Algorithm的結果即依此得到。根據此種想法,我們在此方面的研究方向可分述如下:

1.Combinational Algorithm設計

由於LP的解法方式比較像是將一個問題丟到一個機器後得出一個好的結果,中間的過程我們無法得知,故如何針對題目的特性,設計出一個比較直接的算法,是十分有意義的,可以因為題目特性的了解更能因此改進運算速度。尤其我們目前的混合方式(hybrid)演算法前半段採用LP rounding,後半段均已是Combinatorial Algorithm設計,如此即可得出一個全部的 Combinatorial Algorithm設計。

2.部分LP Rounding的應用

我們目前在Ring上的Multicast Congestion已得出了好的結果,希望能將此種求解方式運用到其他問題上。尤其是許多已知問題解答,很可能運用此方法對其目前的Approximation Solution加以改善。


Optical Computing

光纖計算問題的解決,由於相關零件製造技術日趨成熟已進入了一個新的境界,我們的研究涵蓋了許多題目,除了針對最基本的Logical Topology方面我們提出了一個新的方法外,對光纖通訊在WDM架構下的訊息傳送,針對不同的排程問題(Scheduling)提出新的演算法,我們目前主要的貢獻是集中在Ring Optical Network及Linear Optical Network。在Linear Optical Network上的一個結果也已在IEE Communication期刊上發表。而在Ring Network上我們做出了一系列的結果,分別登在IPL及IEEE Transaction on Parallel and Distributed System上。未來三年我們在此方面研究方向主要將以Optimal Node Arrangement, Routing and Wavelength Assignment (RWA), 以及 Transmission Scheduling上的問題為主要目標。

1.WDM Routing

此方面的結果主要是研究在環狀架構下,如何將一個Optical Routing轉換至其上,並使用最小資源(如波長個數,光波轉換器),此一問題亦可轉換為超圖論上的一個置入(embedding)的問題,我們首先證明最佳解的問題是一個NP-Complete,然後將此問題formulate成ILP問題,ILP問題的近似演算法設計是我們在此問題上的重要研究方向,此方向結果不僅可以運用在WDM routing方面,並可延伸至Multicast Congestion, 分散及平行計算。

2.Transmission Scheduling

目前在光纖架構下的傳送,有許多重要計算的問題,其中牽涉到資源分配,及實際零件的性能,在此方面,我們希望能夠在有限資源設計一個有效率傳輸的方法,其中最主要的構想是將使用者分類,同一群體忠的資料傳輸採用相同波長,不同群體中,我們就必須設計一個有效排程方法,使資源傳輸能儘早完成,我們希望提出此一想法,能和目前一般的方法做一比較,分析,在節省多少資源下,我們的傳輸效率不會變差。

3.Survivable Network Design

此方面研究主要是探討光纖架構下,如有兩點間連線中斷,則如何迅速找到有效替換路徑,解決此問題的技巧,主要是將此問題先用圖論表示,而後再用ILP將此問題的最佳解求法計算出來,但因ILP求解速度較慢,各種不同的近似演算法均提出,目前最主要都是利用cut的觀念來確保Network可以Survivable,但相對地在整體網路平衡負載方面,則無法顧及,我們目前提出利用Disjoint Cycle方式來解決此一現象,初步實驗結果顯示,我們算法雖然在network survivability方面並無法超越cut的演算法,但在平衡負載方面卻有較好的表現。此外,我們目前正在構思利用圖論中的ear-decomposition技巧來做更進一步的分析及比較,希望能得出更好的結果。


Mobile Computing

Location Management

此方面的成果主要集中在階層式(Hierarchical Location Database)架構下的一些相關問題探討。在目前傳統的兩層式HLR/VLR的資料庫架構,由於無限通訊的使用人數持續增加,一定會造成HLR所需提供服務量太大,造成系統效益不佳,故某種形式的階層式架構必定會取代現有雙層式架構來儲存使用者的位置,但由於階級的增加,FIND和MOVE的使用者位置追蹤策略就必須做不同的改進,其主要目的是減少Access或Update不同層級的資料庫,並能迅速找到接聽者的位置。Bypass pointers是目前經常被用來增加系統效益的方法,而我們提出三篇論文討論此問題,而且也利用理論分析及實驗模擬來驗證我們的成果。我們論文主要成果如下:

1.Bypass pointer位置決定:

我們提出幾種不同方式來決定Bypass pointer建構位置和一般位置的固定位置方式不同,我們的策略希望能因使用者特性不同,動態建構各自Bypass pointer位置。

2.Bypass pointer的維護策略:

由於每個Bypass pointer能支援的區域是固定的,但若是有些使用者經常有移動並接受許多通訊,此類使用者的Bypass pointer及必須有不同的方式來建構及處理。我們提出了一個利用演算法設計中的lazy策略來維護Bypass pointer。利用使用者特性,對於暫時失效的Bypass pointer,並不立即刪除必須等到使用者移動方式確定後再決定刪除或保留,降低維護Bypass pointer的成本,並進而提昇追蹤使用者位置的效益。

3.使用者位置追蹤策略改進:

在階層式架構下的追蹤策略,多數都是在雙層式架構下的Caching及Forwarding兩種方式的修改,由於兩種策略面對不同的使用群各有其優勢,我們分別提出了兩篇論文。一篇是利用Preset策略改善Caching,另一篇是利用Local Anchor方式改善Forwarding,此方面的新策略提出在概念上是一些小的修改,我們亦利用實驗方式驗證此種策略改進方式的效益。


Machine learning

隨著資訊科技的進步,Machine Learning與Pattern Recognition裡的問題定義也因此多變,近年來有許多方法應用於不同的資料與環境上,如:文件(text documents)、圖像(images)、影片(videos)、與生物學(biology)。在分類問題裡,會因為各類別裡資料分布情形不一,造成dominant class bias問題;也會因為不同類別內的文件過於相似,會有類別界定模糊(ambiguous class boundary)的問題。在基本的分類方法加入類別的架構(hierarchy)後,hierarchical classification可將問題切割成多個domain-specific的小問題,以提高分類效率,強化文件特徵(features)的辨識性。除此之外,根據近期文獻的探討,此問題的延伸可被歸類成以下三種研究方向。

1.Lazy Learning

考量產生大量訓練資料的困難度,當只用少量訓練資料產生分類器時,分類效果將無法維持一定的水平。此時,可採用lazy learners,只參考部份的訓練資料以量身訂做分類準則,藉以提高分類正確率。

2.Active Learning

當獲得未標示類別(unlabeled)的資料時,為了減少人工標示的負擔,採用Active Learning方法,根據現有的訓練資料,判斷未標示類別資料是否能強化分類準則,減少所需的訓練資料量。

3.Incremental (Online) Learning 分類系統若將於網路上提供線上服務,分類準則會隨時間而變動,在擁有大量訓練資料下,更新分類器會面臨效率不足的問題,也需考慮到存放資料的磁碟空間問題。Incremental Learning針對前者,探討持續更新分類器的效率及正確率;而online learning在更新分類準則的同時,不再保留參考過的樣本,免除資料存放的負擔。

以上三種learners是為了real-world information systems所需採用建置的方法。除此之外,針對real-world datasets本身的特性,得額外增加類別的特徵,強化類別間的區隔;並且考量training data產生不易,不考慮常用的over-sampling與under-sampling方法,我們將以不更動原始資料為原則,解決imbalanced datasets所帶來的bias prediction問題。

©2013 ACL, CCU