標(biāo)題:圍標(biāo)串標(biāo)問題的審計(jì)分析思路
招標(biāo)投標(biāo)是建筑業(yè)適應(yīng)社會(huì)主義市場經(jīng)濟(jì)發(fā)展的一種重要經(jīng)濟(jì)手段,其主要目的是通過公平的競爭推動(dòng)市場經(jīng)濟(jì)的良性循環(huán)。而圍標(biāo)串標(biāo)的現(xiàn)象的發(fā)生,損害了招標(biāo)人和其他投標(biāo)人的合法權(quán)益,破壞了整個(gè)建筑業(yè)市場誠信體系,招標(biāo)投標(biāo)行為成了專項(xiàng)審計(jì)、經(jīng)濟(jì)責(zé)任審計(jì)等關(guān)注重點(diǎn)。
近年來,各地公共資源交易中心上線了電子招標(biāo)投標(biāo)系統(tǒng),不同投標(biāo)人的投標(biāo)文件是否存在異常一致的情況,可作為圍標(biāo)串標(biāo)問題的審計(jì)切入點(diǎn)。本文以某市住房和城鄉(xiāng)建設(shè)局局長經(jīng)濟(jì)責(zé)任審計(jì)為例,運(yùn)用大數(shù)據(jù)思維,依托電子招標(biāo)投標(biāo)系統(tǒng)后臺(tái)數(shù)據(jù),探索圍標(biāo)串標(biāo)問題的審計(jì)分析思路和操作步驟,助力優(yōu)化建筑領(lǐng)域營商環(huán)境,建立市場公平競爭機(jī)制。
一、數(shù)據(jù)特點(diǎn)及難點(diǎn)
招標(biāo)投標(biāo)項(xiàng)目資料為壓縮文件格式,主要是從電子招標(biāo)投標(biāo)系統(tǒng)后臺(tái)用管理員賬號(hào)下載得到。壓縮文件包括項(xiàng)目注冊、招標(biāo)公告、招標(biāo)文件、中標(biāo)結(jié)果公告、投標(biāo)文件等。其中,投標(biāo)文件包含投標(biāo)公司經(jīng)濟(jì)標(biāo)文件、商務(wù)標(biāo)文件、技術(shù)標(biāo)文件、工程量清單等資料,主要為PDF格式。在該項(xiàng)目審計(jì)中遇到如下困難需要突破:
一是缺乏明確的認(rèn)定投標(biāo)文件異常一致判斷標(biāo)準(zhǔn)。政策實(shí)施部門沒有將圍標(biāo)串標(biāo)問題的認(rèn)定標(biāo)準(zhǔn)進(jìn)行進(jìn)一步的細(xì)化,導(dǎo)致在審計(jì)取證時(shí)問題定性較為困難。
二是單一項(xiàng)目文件體量大。某些資金量大、技術(shù)復(fù)雜程度高的招標(biāo)投標(biāo)項(xiàng)目資料,涉及投標(biāo)單位多,技術(shù)標(biāo)文件內(nèi)容圖表多且復(fù)雜,單個(gè)項(xiàng)目壓縮文件大小高達(dá)幾GB,從被審計(jì)單位下載受限于下行帶寬,數(shù)據(jù)采集效率低。
三是數(shù)據(jù)標(biāo)準(zhǔn)化程度低。技術(shù)投標(biāo)文件的PDF格式與我們經(jīng)常使用的XLS表格、DOC文檔格式不同,為非結(jié)構(gòu)化數(shù)據(jù),將其轉(zhuǎn)化為非標(biāo)準(zhǔn)化數(shù)據(jù)無法直接進(jìn)行分析,不利于及時(shí)開展建設(shè)項(xiàng)目中技術(shù)投標(biāo)文件批量比對(duì)工作。
二、審計(jì)思路和方法
(一)審計(jì)思路
技術(shù)標(biāo)文件根據(jù)不同項(xiàng)目類型及技術(shù)要求編寫,沒有固定格式,因此各個(gè)投標(biāo)單位的技術(shù)標(biāo)文件不會(huì)存在內(nèi)容一致的情況。此次審計(jì)使用大數(shù)據(jù)查重軟件來分析同一項(xiàng)目內(nèi)的技術(shù)投標(biāo)文件重復(fù)率,發(fā)現(xiàn)是否存在異常一致的問題。為提升審計(jì)質(zhì)量,審計(jì)組運(yùn)用研究型思維拓展思路,從以下方面解決難點(diǎn):
一是確定投標(biāo)文件異常一致的標(biāo)準(zhǔn)。通過使用第三方查重軟件平臺(tái),可以將各個(gè)投標(biāo)文件之間的重復(fù)率匯總為表格,將重復(fù)率較高的兩家公司的投標(biāo)文件重復(fù)部分標(biāo)紅,找出兩家公司的投標(biāo)文件中標(biāo)紅部分的錯(cuò)詞錯(cuò)符號(hào),確定錯(cuò)誤一致的部分,以重復(fù)率加錯(cuò)誤一致數(shù)作為數(shù)據(jù)分析疑點(diǎn)的標(biāo)準(zhǔn)。
二是確定數(shù)據(jù)分析算法。此次審計(jì)使用基于java語法的xincheck文本查重軟件作為主要分析算法,ocr識(shí)別(圖片文字識(shí)別)使用其內(nèi)置的Spire Doc模塊,設(shè)置連續(xù)13個(gè)字符重復(fù)則認(rèn)定為抄襲作為查重閾值,最后使用WPS文檔校對(duì)功能統(tǒng)計(jì)錯(cuò)詞錯(cuò)符號(hào)。
三是確定數(shù)據(jù)整理方法。運(yùn)用虛擬機(jī)和多線程下載項(xiàng)目文件壓縮包,用壓縮軟件查找并提取壓縮包中的技術(shù)標(biāo)文件,并使用批量文件重命名軟件將其以投標(biāo)公司作為文件命名,并用圖片文字識(shí)別模塊將PDF圖片文件轉(zhuǎn)化為DOC文字文件。(審計(jì)工作:CAE101)
(二)方法步驟
一是將采集到的投標(biāo)項(xiàng)目資料壓縮包通過bandizip壓縮軟件打開,使用查找功能找到技術(shù)標(biāo)文件并解壓至項(xiàng)目名稱命名的文件夾,通過Advanced Renamer批量重命名工具的一次性批量修正功能將技術(shù)標(biāo)文件以“投標(biāo)公司名稱”的作為文件命名,生成PDF文件保存在項(xiàng)目名稱文件夾中。
二是使用xincheck文本查重軟件,將查重閾值設(shè)置為13,模式設(shè)置為橫向比對(duì),選擇項(xiàng)目名稱文件夾作為待查文件所在的文件夾,然后在項(xiàng)目名稱文件夾新建一個(gè)文件夾,作為查重報(bào)告所在文件夾,點(diǎn)擊開始查重,即生成RTF格式的查重報(bào)告,和匯總各技術(shù)標(biāo)文件重復(fù)率的Excel表格。
三是用WPS文字打開重復(fù)率高于40%的查重報(bào)告,使用WPS文字中的文檔校對(duì)功能將錯(cuò)詞錯(cuò)符號(hào)列出,從中剔除掉非紅色句子部分及校對(duì)不準(zhǔn)確的詞,將錯(cuò)詞錯(cuò)符號(hào)突出顯示,在匯總表格中記錄錯(cuò)誤一致個(gè)數(shù)。
四是將查重報(bào)告中錯(cuò)詞錯(cuò)符號(hào)部分與源技術(shù)標(biāo)文件查找核對(duì),排除因OCR識(shí)別PDF文件不準(zhǔn)確造成錯(cuò)誤的情況,最終生成投標(biāo)文件異常一致疑點(diǎn)匯總表。