首先,來說一下做站為什么要講心態(tài),冰凍三尺,非一日之寒。凡事都有其規(guī)律和過程,急不得。最可惜的是在勝利的前夜撤退。這些撤退的人往往是沒有意識到事物的正常規(guī)律,錯誤判斷了形勢。比如短期獲利和長期發(fā)展的取舍,就是一個大家經(jīng)常會遇到的問題。什么叫短期獲利,比如放彈窗,幫人掛馬……這些短時間都挺賺錢,又或者是在論壇過度做廣告,短期內(nèi)流量也會上來很多。但是過后呢?經(jīng)常是一個站就這樣廢掉了。
許多人忙忙碌碌好幾年,發(fā)現(xiàn)自己沒有做成一個站。而一些比自己做站晚的,所謂很笨的站長,反而成功了,就是心態(tài)的差別。但是另一個極端就是過于求大。好多人做站,上來就弄服務(wù)器,甚至請專職技術(shù)、專職美工來幫忙。但我覺得除非本身就財大氣粗,剛開始做站是不宜投資過大的。初期除了域名其他都可以免費或低價湊合。前幾天在參加應(yīng)老K邀請參與的5.16高端站長聚會上認識的小邪,他的小說站每天pv2000萬。但他剛做站時,就是很多空間拼起來用的。順便講講什么是做站的核心資源。域名和數(shù)據(jù)是核心資源,千萬不能丟。但是域名不一定用太好的,站好比域名好值錢。不宜盲目追求過于貴的域名。
一個好的域名可以帶來很大的天然流量,也方便網(wǎng)友記憶,甚至是企業(yè)品牌和實力的象征。但在265的同事中,也有和老蔡持不同意見的人。他們認為許多網(wǎng)民根本不記憶域名,往往是用收藏夾來存網(wǎng)站的。我現(xiàn)在的想法是,在中國做站,域名不能太難記,如果用一長串英文或者無意義的字母,不利于推廣。但是要認識到相當(dāng)多的網(wǎng)民喜歡用收藏夾。因此,不管自己域名好不好,都要大力鼓勵用戶收藏自己的網(wǎng)站。普通的站,你即使用技術(shù)手段讓用戶設(shè)為主頁,用戶也會改掉。但是,你讓他收藏,如果他覺得你的站確有特色,是不會反感的。
我05年開始做站的,當(dāng)時已經(jīng)沒什么好域名可注冊了。域名大佬們說2000年前好米就被注冊光了。我當(dāng)時就注冊了幾個比較長的拼音域名,有十幾個字母吧。有人就說你的域名太長了,不好。但是后來無意中發(fā)現(xiàn),拼音域名在和你域名同音的關(guān)鍵詞上權(quán)重特別高。這其實是百度和谷歌在中文搜索方面的技術(shù)競爭造成的,對網(wǎng)民是好事,對站長更是好事。因為如果你注冊不到,或者買不起特別短的域名,你可以注冊個拼音域名,一樣好用,好記。這是中國特色,老外不懂拼音,我們還有機會選到好的域名。
說完域名,我們談?wù)剶?shù)據(jù)的重要性。數(shù)據(jù)一定要定期備份,不然發(fā)展越快,損失越大。這是我的教訓(xùn),大家一定要記住。我最早的網(wǎng)站是放在一個朋友的空間里。我朋友在電信局,我認為電信的服務(wù)器肯定不會出錯。所以沒有經(jīng)常備份。后來有一次,我突然發(fā)現(xiàn)網(wǎng)站打不開了。然后上ftp一會能上,一會兒不能上。我沒在意,以為是網(wǎng)絡(luò)故障第二天,我那朋友告訴我,我用的空間所在的服務(wù)器硬盤壞了。當(dāng)時萬幸的是我比較大的一個站已經(jīng)放在自己托管的服務(wù)器上了,損失的主要是個人主頁和博客的數(shù)據(jù)。后來,我花了幾個晚上通過百度快照等,才把博客內(nèi)容恢復(fù)了。大家在選擇空間時,也要問清楚空間商提不提供定期備份,如果沒有,就自己定期手工備份。
數(shù)據(jù)說完了,我們說說采集還是人肉的選擇。人肉就是人肉更新,即手工更新。經(jīng)常有站長說自己采集了幾百萬條數(shù)據(jù),收錄增加了多少,錢賺了多少。我們也經(jīng)常會看到什么自動采集,自動設(shè)關(guān)鍵字,自動更新的軟件廣告。那些采集軟件也就幾百塊,每個人咬咬牙就能買一套。但是采集是萬能的嗎?如果大家都采集了,互聯(lián)網(wǎng)上就是不斷循環(huán)的有限重復(fù)內(nèi)容了。我曾經(jīng)在幾家門戶網(wǎng)站做過編輯。最初,是大家爭著上采集系統(tǒng),以增大新聞量,減輕編輯的勞動壓力。但是,我了解到,多家門戶一度使用非常先進的采集系統(tǒng),現(xiàn)在回過頭拋棄了采集,開始讓編輯手發(fā)。為什么?因為搜索引擎已經(jīng)能識破大多數(shù)機器采集的特征,無論谷歌還是百度都喜歡原創(chuàng)的,去重,是百度的核心規(guī)則。
我有個朋友搞過搜索引擎相關(guān)的技術(shù),他告訴我,搜索引擎是會判斷文章的原創(chuàng)“指紋”的。比如老k原創(chuàng)了一篇博客,我采集過來,替換了一些關(guān)鍵字。百度和谷歌還是能認出來我是抄老k的,為什么?因為指紋沒有變。而且,人肉(手工更新)還有一個好處,就是內(nèi)容質(zhì)量的把握。機器采集的話,符合規(guī)則的都抓過來,人工更新,對于文章優(yōu)劣是有基本的判斷的。大家在上網(wǎng)時,對于哪個站是采集的還是人肉的,相信很多時間自己就能感覺出來。另外,在中國做站,有一些地方特色,比如哪些內(nèi)容不能發(fā)。這些敏感內(nèi)容僅靠關(guān)鍵詞過濾是不夠的,不如人工更新來得安全。比如一張圖片是否低俗,是否露點,機器識別不出來。有這類的軟件,但識別率不高,無法應(yīng)用于采集。即使是要采集,建議大家先采集入庫,再人工審核。這樣兼顧了效率與質(zhì)量。