本網(wǎng)訊 近日,由北京大學(xué)電子政務(wù)研究院、中國新一代IT產(chǎn)業(yè)推進(jìn)聯(lián)盟及首席數(shù)據(jù)官聯(lián)盟共同發(fā)布了2016年《中國大數(shù)據(jù)企業(yè)排行榜》。北京智慧星光信息技術(shù)有限公司在多個(gè)領(lǐng)域均榜上有名,其中在文本挖掘領(lǐng)域榮獲榜首,在自然語言處理,社交數(shù)據(jù)分析,以及智慧公安應(yīng)用方面獲得第二名的好成績。
智慧星光研發(fā)中心
在文本數(shù)據(jù)挖掘上,智慧星光利用獨(dú)有的規(guī)則與統(tǒng)計(jì)相結(jié)合的中文文本分詞法,有效地解決中文詞語切分過程中的歧義問題。這種方法摒棄了搜索網(wǎng)站的傳統(tǒng)分詞法,不但大大提高了信息檢索、抽取、搜索的速度,也使分詞準(zhǔn)確率提高到99.6%,這是傳統(tǒng)搜索引擎公司無法做到的。
人類的語言承載著豐富的情感信息,尤其是中文,一句“你沒事兒吧”可以變換出三四種不同的含義,這在自然語言處理中給計(jì)算機(jī)設(shè)置了巨大的障礙。智慧星光通過對不同語言要素的識別進(jìn)行文章級別情感的識別,通過多年增量訓(xùn)練與專家積累的中文傾向性句式和短語的連用關(guān)系識別技術(shù),仿照人類思維邏輯,實(shí)現(xiàn)人工智能邏輯判別處理,負(fù)面文章識別率高達(dá)97%。
在社交數(shù)據(jù)分析中短文本的分析一直都是難點(diǎn),由于短文本自身的特點(diǎn),例如文本很短、表示不規(guī)范、特征稀疏等,自然經(jīng)典的文本分類算法在短文本上效果不佳,準(zhǔn)確率和召回率都很低。為此,智慧星光提出了語義范式的概念,即基于語義的關(guān)鍵詞約束表達(dá)式。運(yùn)用這種專利方法智慧星光將短文本的準(zhǔn)確率從70%提高到95%。
在技術(shù)上的突破使得智慧星光不僅獲得企業(yè)的青睞也獲得了黨政機(jī)關(guān)的廣泛認(rèn)可,在公安行業(yè)擁有500家以上的正式客戶,宣傳部門擁有400家以上的正式客戶,客戶續(xù)單率達(dá)到99.5%。
智慧星光(www.istarshine.com)作為大數(shù)據(jù)處理分析及應(yīng)用開發(fā)領(lǐng)域的國家高新技術(shù)企業(yè),一直以技術(shù)創(chuàng)新為第一生產(chǎn)力,提供最精準(zhǔn)的信息和最有價(jià)值的數(shù)據(jù),實(shí)現(xiàn)信息有效對稱和數(shù)據(jù)價(jià)值最大化,持續(xù)為客戶提供 “極簡、極致、滿意”的產(chǎn)品和服務(wù)。
貴賓咨詢:18101094004 張君(商務(wù)經(jīng)理)
|