幕思城>電商行情>開店>開網(wǎng)店>阿里媽媽智能圖象識別技術(shù)如何查詢違規(guī)商家

    阿里媽媽智能圖象識別技術(shù)如何查詢違規(guī)商家

    2023-01-19|13:51|發(fā)布在分類 / 開網(wǎng)店| 閱讀:78

    阿里媽媽的智能圖像識別技術(shù)如何查詢非法商家?

    細(xì)心的消費(fèi)者一定知道手陶濤的“派麗陶濤”功能。

    該功能實(shí)際上利用了智能圖像識別技術(shù)。

    以前一些無良商家把違法信息藏在圖片里,以為可以逃過淘寶的搜索。

    現(xiàn)在,這招不管用了。

    同樣,智能圖像識別技術(shù)在其中扮演著重要的角色。

    那么,智能圖像識別技術(shù)具體是如何識別復(fù)雜的圖片信息的呢?

    阿里媽媽資深算法專家余婧向記者介紹了阿里媽媽在這方面的技術(shù)突破。

    據(jù)悉,依托該技術(shù),阿里媽媽每周可以打擊各類違規(guī)行為上萬次,相應(yīng)的圖像技術(shù)也已經(jīng)應(yīng)用到阿里巴巴集團(tuán)。

    以下是靖宇的分享圖,顯示為趨勢。

    打開購物網(wǎng)站,占據(jù)空間最大的無疑是圖片。

    對于用戶來說,商品的圖片有一種文字無法表達(dá)的真實(shí)感和可信度。

    可以說,圖片已經(jīng)成為商品展示的最佳方式。

    在展示商品的同時,圖片也成為非法內(nèi)容欺騙消費(fèi)者的主要庇護(hù)所。

    原因是圖像識別太難了。

    但阿里媽媽作為營銷平臺,對圖片內(nèi)容的審核要求極高。

    首先,借助圖像識別能力,阿里媽媽可以獲得完整的圖像信息,從而提高CPR預(yù)估的準(zhǔn)確性和推廣效果。

    其次,隨著打擊力度的深入,違法的宣傳文字逐漸轉(zhuǎn)移到圖片上,同時也出現(xiàn)了商家違法使用著名商標(biāo)的情況。

    為此,阿里媽媽投入了大量的工作來改進(jìn)圖像識別算法。

    經(jīng)過幾年的積累,已經(jīng)有兩項(xiàng)重要的技術(shù)上線來應(yīng)對上述問題,分別是“圖像字符識別”和“商標(biāo)檢測系統(tǒng)”。

    基于這兩種算法,智能圖像識別技術(shù)已全面覆蓋智能審核等應(yīng)用場景,每周可打擊各類違規(guī)行為1萬次以上。

    相應(yīng)的圖像技術(shù)也已經(jīng)應(yīng)用到阿里巴巴集團(tuán)。

    字符識別字符識別,顧名思義就是從圖片中識別字符,大家并不陌生。

    掃描書籍、掃描文檔、車牌識別就是這樣的技術(shù)。

    但是這些技術(shù)通常都要限制場景,一種技術(shù)只能用在特定的場景。

    阿里媽媽面對的目標(biāo)圖景是完全不同的,它的特點(diǎn)是非特異性和不確定性。

    比如字體非常豐富,有變形、搭配、排版等復(fù)雜情況。

    有了背景,可以說識別算法難度極大。

    甚至有一個名為ICDAR的國際學(xué)術(shù)會議,專門討論這類問題。

    我該怎么辦?

    阿里媽媽最后提出了“場景圖片人物識別技術(shù)”。

    場景識別的歷史2014年8月,OCR(圖片中的字符識別)項(xiàng)目啟動,2014年11月第一版算法上線。

    實(shí)現(xiàn)的功能是將商品圖片中的文字描述提取出來,作為宣傳資料投放到終端用戶中,改善之前宣傳標(biāo)題或文字資料不足的情況。

    2015年4月,圖片和文字識別在阿里媽媽的點(diǎn)評場景下全面上線。

    評審工作從人工到半自動評審階段,評審時間為T+1天。

    2015年10月,后期技術(shù)優(yōu)化審核只需要幾秒鐘。

    也就是說,商家上傳促銷創(chuàng)意圖片后幾秒鐘,阿里媽媽就能給出識別結(jié)果,并通過運(yùn)營部門預(yù)定義的規(guī)則,快速對圖片進(jìn)行預(yù)處理和判斷。

    如果有任何可疑的違規(guī)行為,也可以立即處理。

    你一定很好奇。

    你是怎么做到的?

    智能算法有完整的迭代方案。

    傳統(tǒng)的OCR(圖片中的字符識別)技術(shù)可以分為定位、分割、識別等部分。

    每一部分都會涉及到大量人為設(shè)計(jì)的特征項(xiàng)目或者人為的規(guī)則,需要花費(fèi)大量的精力去觀察人物的特征。

    我們發(fā)現(xiàn)這種想法的識別率很低。

    阿里媽媽采用的方法是依靠深度學(xué)習(xí)技術(shù),即模型學(xué)習(xí)大量數(shù)據(jù),從而獲得的“知識”強(qiáng)于人工識別的能力。

    這就需要利用大規(guī)模數(shù)據(jù)來完成訓(xùn)練和識別。

    摒棄特定工程的邏輯和人為的規(guī)則,使得阿里媽媽的算法在迭代和更新上有了顯著的提升。

    今年6月,阿里媽媽影像團(tuán)隊(duì)的OCR技術(shù)刷新了ICDAR Robust。

    閱讀爭奪數(shù)據(jù)集世界最好成績,大幅超越第二名。

    借助這一領(lǐng)先的OCR技術(shù),阿里媽媽的圖像團(tuán)隊(duì)能夠以95%的超高準(zhǔn)確率識別圖片中的非法文字信息,有效過濾商家的惡意推廣,維護(hù)消費(fèi)者權(quán)益。

    2015年,阿里媽媽共屏蔽惡意促銷4600萬次。

    商標(biāo)檢測系統(tǒng)在淘寶或者天貓,有些商家會故意在標(biāo)題、詳情頁、商品屬性等地方隱藏商品的品牌信息,侵權(quán)名品品牌意圖明顯。

    以前阿里的運(yùn)營者很難發(fā)現(xiàn)這種圖片式的侵權(quán)。

    為此阿里媽媽開發(fā)了一個LGOG(商標(biāo))檢測系統(tǒng),可以減少品牌侵權(quán),同時這個系統(tǒng)可以統(tǒng)計(jì)平臺上所有的商品品牌,然后進(jìn)行統(tǒng)計(jì)分類。

    鑒定樣本是一個巨大的挑戰(zhàn)。

    阿里平臺有上億個品牌,這對系統(tǒng)的工作效率提出了嚴(yán)峻的挑戰(zhàn)。

    其次,商標(biāo)識別涉及的場景具有多樣性的特點(diǎn)。

    第三,商標(biāo)本身客觀上存在一些傾斜、變線,或者遮擋、面積小等問題。

    ,算法識別易受干擾。

    2014年,商標(biāo)檢測系統(tǒng)上線,經(jīng)過多輪迭代優(yōu)化,阿里媽媽已經(jīng)基本形成了一套完整的品牌管理、線上線下結(jié)合的算法解決方案。

    效果突出,比如一秒鐘內(nèi)可以識別上萬個商標(biāo),隨時配置擴(kuò)充品牌庫,準(zhǔn)確率高達(dá)95%。

    不要用不正當(dāng)競爭,有運(yùn)氣,技術(shù)不斷迭代更新,讓交易生態(tài)更加健康完善。

    :《淘寶盜圖處罰細(xì)則》如何處理盜圖投訴?

    怎么上訴?

    淘寶會員名字可以修改嗎?

    查看如何修改淘寶會員名稱。

    這個問題還有疑問的話,可以加幕.思.城火星老師免費(fèi)咨詢,微.信號是為: msc496。

    難題沒解決?加我微信給你講!【僅限淘寶賣家交流運(yùn)營知識,非賣家不要加我哈】
    >

    推薦閱讀:

    直通車圖有什么要求?淘寶直通車怎么開?

    淘寶直通車多少點(diǎn)擊率正常?如何提升點(diǎn)擊率?(直通車的關(guān)鍵詞當(dāng)中的違禁詞有哪些?)

    京東年貨節(jié)什么時候預(yù)熱?產(chǎn)品折扣大不大

    更多資訊請關(guān)注幕 思 城。

    發(fā)表評論

    別默默看了 登錄\ 注冊 一起參與討論!

      微信掃碼回復(fù)「666