資源描述:
《基于演化算法的序回歸技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、胃奪綺達(dá)4朵*賽嗎UniversitofScie打ceandTechnologyofGhi打ay碩±學(xué)位論文、基于讀化算法的序巧切技術(shù)研堯論文題目么玉_奇作者姓名.■計(jì)專機(jī)應(yīng)用化術(shù)學(xué)利■專業(yè)屢巧教援導(dǎo)師姓名—二〇六■年五月完成時(shí)間奪固?!度舳浯筚悾?,碩d:學(xué)位論文參基于演化算法的序回歸揉術(shù)研究作者姓名:伍玉舟學(xué)科專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)導(dǎo)師姓名:唐巧教授—完成時(shí)間:二0六年五月Unive巧ityofScie
2、nceandTechnologyofChina'iA?dissertationformastefsde巧eg幽巧OrdinalReressionTechniuesgqBasedonEvolu村onarAlorithmsygAuthor:YuzhouWuSecialit:ComuterTechnoloandAlicationspypgyppSupervisor:Prof.KeTangFinishedTime:Ma201
3、6y,中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下進(jìn)行研究工作所取得的成果。除已特別加La標(biāo)注和致謝的地方外,論義中不包含任何他人已經(jīng)發(fā)表或撰寫過的研究成果一同工作的同志對(duì)本研究所做的貢獻(xiàn)均已在論文中作了明。與我確的說明。-i4:作者簽名枝:L種簽字日期:中國(guó)科學(xué)技術(shù)大學(xué)學(xué)位論文授權(quán)使用聲明一作為申請(qǐng)學(xué)位的條件之,學(xué)位論文著作權(quán)擁有者授權(quán)中國(guó)科學(xué)技術(shù)大學(xué)擁有學(xué)位論文的部分使用權(quán)目:,P學(xué)校有權(quán)按有關(guān)規(guī)定向國(guó)家有關(guān)部口或機(jī)構(gòu)^《送交論文
4、的復(fù)印件和電子版1,允許論文被查閱和借閱,可乂時(shí)學(xué)位論文編入中》國(guó)學(xué)位論文全文數(shù)據(jù)庫等有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可1^^>采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。本人提交的電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相—致。保密的學(xué)位論文在解密后也遵守此規(guī)定。nIZ^公開□保密年?:作者簽名怔支符導(dǎo)師簽名:初簽字日期:簽字日期:摘要摘要一,數(shù)據(jù)的類別之間存在種自然的序關(guān)系,在很多實(shí)際應(yīng)用中。例如我們用一?15星去評(píng)價(jià)部電影,3星評(píng)價(jià)高于2星評(píng)價(jià),而4星評(píng)價(jià)低于5星評(píng)價(jià)。
5、一和標(biāo)稱數(shù)據(jù)不同,我們稱這樣類數(shù)據(jù)為有序數(shù)據(jù)。有序數(shù)據(jù)的類別之間可排序,3星評(píng)價(jià)通常被認(rèn)為,但類別之間的差異卻沒有精確的定義。例如對(duì)電影的優(yōu)于2星評(píng)價(jià),但是3星究竟比2星好多少卻難L義曼;hU預(yù)測(cè)有序數(shù)據(jù)的序的學(xué)、習(xí)問題,稱之為序回歸。序回歸有著廣泛的實(shí)際應(yīng)用場(chǎng)景,例如情感分析信息檢索、推薦系統(tǒng)、信用評(píng)價(jià)、醫(yī)學(xué)等。一序回歸問題作為機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘領(lǐng)域重要的問題之,越來越受到研究者們的關(guān)注,。已有的王作主要集中在研究有監(jiān)督序回歸問題。然而當(dāng)缺少足夠的有標(biāo)簽數(shù)據(jù)時(shí),該問題變得難1^
6、^處理。在很多實(shí)際應(yīng)用中,有標(biāo)簽數(shù)據(jù)往往難W獲取并且校對(duì)起來代價(jià)很高。而無標(biāo)簽數(shù)據(jù)通常大巧存在,并且易于獲得。因此,同時(shí)考慮有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù)的半監(jiān)督序回歸問題具有重要的研究意一定的研究和討論義和實(shí)際價(jià)值。本文化此為動(dòng)機(jī),對(duì)半監(jiān)督序回歸問題做了。本文提出了一種基于化權(quán)核判別分析的半監(jiān)督序回歸技術(shù)一。該算法通過個(gè)化權(quán)策略來引入無標(biāo)簽數(shù)據(jù),而權(quán)重體現(xiàn)了不同訓(xùn)練數(shù)據(jù)對(duì)于類分布的貢獻(xiàn)大小。通過同時(shí)使用有標(biāo)簽數(shù)據(jù)和無標(biāo)簽數(shù)據(jù),可UX更準(zhǔn)確地估計(jì)類的分布信息一一維的,從而獲得更好的投影向
7、量和閥值。該投影向畳將原始數(shù)據(jù)映射到個(gè).空間,使得相鄰類別之間可^^分隔開X、相同類別的數(shù)據(jù)可L:聚合緊同時(shí)保持正確的序關(guān)系一;閥值用來預(yù)測(cè)新樣例的序。該算法使用種標(biāo)簽傳播的方法來計(jì)算權(quán)重。然而,由于標(biāo)簽傳播算法沒有考慮數(shù)據(jù)中的序信息,導(dǎo)致估計(jì)的權(quán)重有時(shí)不是很準(zhǔn)確一。為了更準(zhǔn)確地估計(jì)類的分布信息并進(jìn)步提升性能,我們提出了改—基于演化算法的半監(jiān)督序回歸技術(shù)進(jìn)的算法。該算法通過使用演化算法來。優(yōu)化無標(biāo)簽數(shù)據(jù)的權(quán)重,優(yōu)化目標(biāo)是使學(xué)習(xí)器擁有良好的學(xué)習(xí)性能和泛化能力由于同時(shí)引入了無標(biāo)簽數(shù)據(jù)和序信息
8、一,所該問題是個(gè)非凸且不可導(dǎo)的優(yōu)化問題。演化算法適用于處理這類問題,我們?cè)诒疚氖褂貌罘诌M(jìn)化算法。為了降低優(yōu)化問題的維度一,本文提出了種權(quán)重更新規(guī)則和個(gè)體表示方法,用來間接地演化權(quán)重。通過該方法,問題維度從無標(biāo)簽樣例個(gè)數(shù)屋級(jí)下降到序個(gè)數(shù)呈級(jí)。在多。個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果,證明了本文提出的兩個(gè)半監(jiān)督序回歸算法的有效性:關(guān)鍵詞序回歸,,,半監(jiān)督學(xué)習(xí),核判別分析,標(biāo)簽傳播演化