
在評估一個量化模型的比較優(yōu)勢時,我們常常會考量它在因子儲備上所能達到的深度和廣度 。因為只有因子積累得足夠多,才有機會具備在任何復(fù)雜的市場環(huán)境下都能獲取阿爾法回報的可能性 。但隨著量化投資的發(fā)展進入到一個相對成熟的階段 , 大部分有效因子都已成為各家量化團隊的標(biāo)配 , 想要在傳統(tǒng)數(shù)據(jù)框架下開發(fā)新的阿爾法因子已經(jīng)愈發(fā)困難 。不過近年來逐步興起的人工智能技術(shù)卻為新因子的開發(fā)打開了視野,本文就主要介紹文本挖掘技術(shù)在因子開發(fā)中的一些應(yīng)用案例 。
【愛情與婚姻的名言】首先一個簡單的案例就是可以通過文字匹配的方式來判斷一篇研究報告的投資傾向愛情與婚姻的名言 。比如我們要從一篇分析師所撰寫的研究報告中了解到他對這家上市公司的看法究竟是正面或是負(fù)面,乃至推薦力度如何 , 我們通常會從該分析師在行文中的語義表達去進行感性認(rèn)知 。但顯然我們沒有足夠的精力去閱讀所有分析師和所有上市公司的相關(guān)研報,那么通過文字匹配的方法來進行模糊判斷就不失為一個次優(yōu)選擇 。比如我們可以在每一篇研報中去搜索已經(jīng)被我們定義為“正向”或“負(fù)向”的字眼,進而對該分析師在該公司上的投資傾向進行評估 ?!罢颉钡淖盅劭梢园ā巴扑]”、“利好”、“改善”和“強勁”等,“負(fù)向”的字眼可以包括“低于預(yù)期”、“不及預(yù)期”、“下行”和“停滯”等 。盡管不能說通過簡單的文字匹配就能精確地度量分析師的投資傾向,但在納入所有分析師和所有上市公司的相關(guān)研報后,誤差還是能夠逐步下降到一個可以接受的范圍之內(nèi)愛情與婚姻的名言 , 我們據(jù)此也就可以開發(fā)出像分析師推薦度等一系列因子 。
更復(fù)雜的文本挖掘技術(shù)則需要運用到像新聞、論壇、微博等輿情數(shù)據(jù)上 。因為這些信息渠道不存在統(tǒng)一愛情與婚姻的名言、標(biāo)準(zhǔn)化的語言表達方式,所以不能使用簡單的文字匹配方法去進行判斷(這樣只會導(dǎo)致大量的漏判和誤判),而需要引入一個叫做“情感分析”的文本分析工具 。情感分析也可以被理解為一個文本分析的黑箱子,只要向這個箱子輸入一段文字,他就可以輸出相應(yīng)的文本分析結(jié)果,比如這段文字的情感色彩如何 , 是樂觀還是悲觀等 。當(dāng)然,考慮到中文語言的博大精深 , 情感分析的精確度難以無限度趨近于100%,但值得肯定的是 , 這個黑箱子通常也具備反復(fù)迭代和優(yōu)化的能力,所以隨著經(jīng)驗的累積我們終可以獲得能盡可能讓我們滿意的分析結(jié)果 。通過對語義明確的文本數(shù)據(jù)進行統(tǒng)計分析我們又可以生產(chǎn)出諸如投資者關(guān)注熱度、看好程度等一系列輿情因子 。
最后 , 從上市公司公告中我們也能通過文本挖掘的方式獲取到一些有意思的另類數(shù)據(jù) 。比如有些上市公司會披露其與其他公司簽訂的合同或達成的協(xié)議等信息,我們就可以通過文本挖掘的方式將這些信息給抓取下來,然后搭建標(biāo)準(zhǔn)化的上市公司關(guān)聯(lián)數(shù)據(jù)庫,在其中記錄交易雙方信息、合同金額、交易時間等信息,這樣就可以便于我們對由某一家上市公司延展開的整個供應(yīng)鏈網(wǎng)絡(luò)進行全貌分析,也能藉此開發(fā)相應(yīng)的選股因子 。以上均是文本挖掘技術(shù)在因子開發(fā)中的一些案例展示 , 具體研究方向還有很多,就不一一展開了 。
猜你喜歡
- 父母包辦的換親婚姻的法律效力
- 婚姻自由權(quán)是基本權(quán)利嗎 婚姻自由權(quán)性質(zhì)
- 遺贈扶養(yǎng)協(xié)議與遺贈的區(qū)別 遺贈扶養(yǎng)協(xié)議與遺贈有什么不同之處
- 微型月季冥王星值得入手嗎 冥王星月季的優(yōu)缺點與特點簡介
- 性學(xué)與愛情心理學(xué)
- 古代四大雅趣與六藝解讀 琴棋書畫屬于四大什么類型
- 我國婚姻法規(guī)定的婚姻自由包括結(jié)婚自由和 我國法律對結(jié)婚自主權(quán)有哪些限制?
- 創(chuàng)業(yè)項目計劃書研究與開發(fā),北京項目創(chuàng)業(yè)計劃書費用
- 女人婚姻情感語錄表達心情的情感語句
- 婚姻自由是什么 什么叫做婚姻自由
