あなたって髪型がスパムねと言われる今日この頃、
いかがお過ごしでしょうか。
こんばんは。
深夜の更新です。
「検索」の行き着くゴールを考えたら、いつかはこうなることは
容易に想像できましたね。
今日はそんなニュース。
▼増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除
http://headlines.yahoo.co.jp/hl?a=20081010-00000044-zdn_n-sci
以下、記事より。
ライブドアは10月10日、「livedoorブログ検索」に、
検索結果にスパムブログを表示しない技術を実装した。
スパムブログを自動判定する技術を新開発。
従来、検索結果の半分ほどスパムだったが、
新技術でスパムの約9割が表示されなくなったという。
スパムブログとは、アフィリエイト収入を得たり、
特定のサイトへ誘導することを目的に
専用ツールを使って自動生成された、内容の伴わないブログ。
別のブログやニュースサイトの記事をそのままコピーしたものや
アフィリエイトリンクを大量に掲載しているもののほか
流行のキーワードや芸能人の名前など
検索されやすい言葉を並べ意味の通らないでたらめの文章
「ワードサラダ」を自動生成し、投稿しているものもある。
同社エンジニアの山下拓也さんによると、
「日々新しいパターンのスパムブログが出てくる」という。
スパムが検索結果に表示されなくなれば、
スパムブログを通じてアフィリエイトで稼ごうとするユーザーが減り
スパムブログ自体も減っていくと期待する。
●10種類のフィルターでスパム排除
livedoorブログ検索では従来、目視と簡単なプログラムを使ってスパムブログを削除していた。新たに、スパムブログを自動判定する新技術を
社内の共通スパムフィルター「スパムちゃんぷるー」に搭載し、ブログ検索に実装した。
新技術は、10種類ほどのフィルタリングシステムを組み合わせている。
詳細は非公開だが、まずはクローラーで収集したブログ記事の中に
ブラックリストに登録されたブログの記事がないかをチェックし
その後フィルタにかける。スパムブログが見つかれば、検索対象から除外する。
収集したブログ記事を、同社が持つ100万件のブログ記事のサンプルと比較し
類似した記事が投稿されていないかを確認する――といったことも行う。
スパムブログの中でも、別のブログ記事をコピーして作ったものが多いためだ。
同社が事前に行ったテストによると、スパムブログを取りこぼした割合は9.7%、
スパムブログではないのにスパムと誤判定した割合は1.8%。
ほかの記事を引用して短いコメントを付けているようなブログ記事は
誤ってスパムと判定してしまう場合があった。
今後はフィルタの種類やブラックリストに登録されたブログの数を増やしていく。
現在ブラックリストには十数万件が登録されているという。
●1人で2000個のIDを作成し、投稿するスパムブロガーも
スパムブログは3〜4年ほど前から増え始めたという。
「ブログがメディアで取り上げられるようになってから増えてきた」と、
井原郁央マネージャーは感じている。
同社の調査によると、スパムブログでよく使われる3つのキーワードで抽出した
90のブログ記事のうち、約66%がスパムだった。
1人で1つのブログサービスに2000以上のIDを作り
スパム記事を大量に投稿するユーザーもいるという。
livedoor ブログのスパム記事の割合は、正確なデータを集計していないが
66%よりは少ないとしている。
大量にスパムブログが生成されるのは、専用ツールが出回っているため。
「アフィリエイトでもうかる方法教えます」と売り込むサイトなどで、
専用ツールが販売されているという。
「スパムブログを通じて最ももうけているのは、専用ツールを売っているユーザーでは」
(井原マネージャー)
●人が見ても判定しづらいスパムが増えている
山下さんによると「人が見てもスパムかどうか判定しづらいスパムブログが増えている」という。
ニュースをコピーし、語尾を関西弁風に変えているというスパム記事もある。
コピー元との類似性を下げることで、
スパムフィルターに引っかかりにくくしているというわけだ。
「日々新しいパターンのスパムブログが出てくるが、
そのパターンはシステムでは判別できず、人間の力に頼るしかない」(山下さん)
スパムブログに関する情報を公開したり、他社と交換するといったことも
積極的に進めていきたい考えだ。ニフティとはスパム判定に関する情報を交換しているという。
「スパム業者に手口を覚えられるからと、
情報や技術を公開したり、交換したがらない企業もあると思うが、
1社で対策するよりは、お互い手を組んだ方がいい。
スパム業者同士も手を組んでやっているような印象がある」(井原マネージャー)
情報公開の一環として今後、ラボサイト「livedoor ラボ『EDGE』」で、
IPアドレスを入力すると、そのアドレスが同社のスパムのブラックリストに
登録されているかどうかを返してくれるサービスを公開する予定。
個人でブログを運営していて、スパムコメントに困っているユーザーなどに
使ってもらうことを想定している。
--------------------------------------------------------
とのこと。
スパム側もまた試行錯誤をしてくるだろうとは思いますが。
でもそれではスパムサイトが減るのはうれしいですね。
アフィリエイトとは本来商品の価値を商品販売者以外の人が
見込み客に伝達させて、その結果収益を生み出すもの。
そのへんからずれてると、いかに儲かっても楽しくないかもしれませんね。
それではおやすみなさい(ぺこり)
さて、ここをクリックしてもらえると俺のテンションとランキングが上がります。
よろしくお願いします。
いかがお過ごしでしょうか。
こんばんは。
深夜の更新です。
「検索」の行き着くゴールを考えたら、いつかはこうなることは
容易に想像できましたね。
今日はそんなニュース。
▼増え続けるスパムブログの現状は ライブドアが検索に新技術、9割排除
http://headlines.yahoo.co.jp/hl?a=20081010-00000044-zdn_n-sci
以下、記事より。
ライブドアは10月10日、「livedoorブログ検索」に、
検索結果にスパムブログを表示しない技術を実装した。
スパムブログを自動判定する技術を新開発。
従来、検索結果の半分ほどスパムだったが、
新技術でスパムの約9割が表示されなくなったという。
スパムブログとは、アフィリエイト収入を得たり、
特定のサイトへ誘導することを目的に
専用ツールを使って自動生成された、内容の伴わないブログ。
別のブログやニュースサイトの記事をそのままコピーしたものや
アフィリエイトリンクを大量に掲載しているもののほか
流行のキーワードや芸能人の名前など
検索されやすい言葉を並べ意味の通らないでたらめの文章
「ワードサラダ」を自動生成し、投稿しているものもある。
同社エンジニアの山下拓也さんによると、
「日々新しいパターンのスパムブログが出てくる」という。
スパムが検索結果に表示されなくなれば、
スパムブログを通じてアフィリエイトで稼ごうとするユーザーが減り
スパムブログ自体も減っていくと期待する。
●10種類のフィルターでスパム排除
livedoorブログ検索では従来、目視と簡単なプログラムを使ってスパムブログを削除していた。新たに、スパムブログを自動判定する新技術を
社内の共通スパムフィルター「スパムちゃんぷるー」に搭載し、ブログ検索に実装した。
新技術は、10種類ほどのフィルタリングシステムを組み合わせている。
詳細は非公開だが、まずはクローラーで収集したブログ記事の中に
ブラックリストに登録されたブログの記事がないかをチェックし
その後フィルタにかける。スパムブログが見つかれば、検索対象から除外する。
収集したブログ記事を、同社が持つ100万件のブログ記事のサンプルと比較し
類似した記事が投稿されていないかを確認する――といったことも行う。
スパムブログの中でも、別のブログ記事をコピーして作ったものが多いためだ。
同社が事前に行ったテストによると、スパムブログを取りこぼした割合は9.7%、
スパムブログではないのにスパムと誤判定した割合は1.8%。
ほかの記事を引用して短いコメントを付けているようなブログ記事は
誤ってスパムと判定してしまう場合があった。
今後はフィルタの種類やブラックリストに登録されたブログの数を増やしていく。
現在ブラックリストには十数万件が登録されているという。
●1人で2000個のIDを作成し、投稿するスパムブロガーも
スパムブログは3〜4年ほど前から増え始めたという。
「ブログがメディアで取り上げられるようになってから増えてきた」と、
井原郁央マネージャーは感じている。
同社の調査によると、スパムブログでよく使われる3つのキーワードで抽出した
90のブログ記事のうち、約66%がスパムだった。
1人で1つのブログサービスに2000以上のIDを作り
スパム記事を大量に投稿するユーザーもいるという。
livedoor ブログのスパム記事の割合は、正確なデータを集計していないが
66%よりは少ないとしている。
大量にスパムブログが生成されるのは、専用ツールが出回っているため。
「アフィリエイトでもうかる方法教えます」と売り込むサイトなどで、
専用ツールが販売されているという。
「スパムブログを通じて最ももうけているのは、専用ツールを売っているユーザーでは」
(井原マネージャー)
●人が見ても判定しづらいスパムが増えている
山下さんによると「人が見てもスパムかどうか判定しづらいスパムブログが増えている」という。
ニュースをコピーし、語尾を関西弁風に変えているというスパム記事もある。
コピー元との類似性を下げることで、
スパムフィルターに引っかかりにくくしているというわけだ。
「日々新しいパターンのスパムブログが出てくるが、
そのパターンはシステムでは判別できず、人間の力に頼るしかない」(山下さん)
スパムブログに関する情報を公開したり、他社と交換するといったことも
積極的に進めていきたい考えだ。ニフティとはスパム判定に関する情報を交換しているという。
「スパム業者に手口を覚えられるからと、
情報や技術を公開したり、交換したがらない企業もあると思うが、
1社で対策するよりは、お互い手を組んだ方がいい。
スパム業者同士も手を組んでやっているような印象がある」(井原マネージャー)
情報公開の一環として今後、ラボサイト「livedoor ラボ『EDGE』」で、
IPアドレスを入力すると、そのアドレスが同社のスパムのブラックリストに
登録されているかどうかを返してくれるサービスを公開する予定。
個人でブログを運営していて、スパムコメントに困っているユーザーなどに
使ってもらうことを想定している。
--------------------------------------------------------
とのこと。
スパム側もまた試行錯誤をしてくるだろうとは思いますが。
でもそれではスパムサイトが減るのはうれしいですね。
アフィリエイトとは本来商品の価値を商品販売者以外の人が
見込み客に伝達させて、その結果収益を生み出すもの。
そのへんからずれてると、いかに儲かっても楽しくないかもしれませんね。
それではおやすみなさい(ぺこり)
さて、ここをクリックしてもらえると俺のテンションとランキングが上がります。
よろしくお願いします。
08/30: 【緊急速報】携帯電話がブロークンしました。
どうも。
アクセス解析の結果
「おっさんのおしり」というキーワードで
1アクセスいただいておりました。
けんとです。
なんて冗談を言っている場合ではございません。
突然、携帯電話(仕事用)が壊れてしまいました。
どなたともご連絡がとれない状況でございます。
月曜日には代替機を準備いたします。
緊急の御用の方は
PCメールにご連絡いただければと思います。
ご迷惑おかけいたしますがどうぞよろしくお願いいたします。
アクセス解析の結果
「おっさんのおしり」というキーワードで
1アクセスいただいておりました。
けんとです。
なんて冗談を言っている場合ではございません。
突然、携帯電話(仕事用)が壊れてしまいました。
どなたともご連絡がとれない状況でございます。
月曜日には代替機を準備いたします。
緊急の御用の方は
PCメールにご連絡いただければと思います。
ご迷惑おかけいたしますがどうぞよろしくお願いいたします。
08/05: 【改善策】FireFoxで文字化けをしてしまう人へ。
こんばんは。
つるとんたんでは必ずうどんを3玉頼みます。
けんとです。
▼つるとんたん
http://www.tsurutontan.co.jp/
さて、FireFoxをバージョンアップしたら
コロンと全角数字が文字化けじゃないか!
どうしてくれるんだ!って方へ。
▼OPUS MAGNUM
http://blog.goo.ne.jp/oko-bou
上記ブログに解決策がでておりましたので
ご紹介いたします。
ここから-------------------------------------------
バージョンアップで話題のFireFox。
結局、ブックマークが使いにくそうなので暫くはFireFox 2を使っていこうと思っています。
そのうちサポート外になってしまうのでしょうけど…。
で、ちょっと前から気になっていたFireFox 2での文字化けがおきている件。
どうせ文字エンコーディングがおかしいのだろうとあまり気にしていませんでした。
化ける文字は全角の数字とコロンのようです。
この文字化けが発生するとニュースサイトを見ていると人の年齢が文字化けしていたり、番組欄を見ていると何時から放送されるのか全然わからなかったり大変です。
全角数字を使わなければ良いのですが、それはページの作成者が決めることですから仕方がありませんね。
すごく気になるのがNHK BSの番組紹介サイトです。
このページを見ると文字化けが目立ちます。
で、さすがに最近あまりに気になるのでちょっと調べてみました。
どうやら原因はFireFoxにあるようで、CSSの設定でフォントの指定が悪いようです。
元凶となるフォントは「Lucida Grande」という名前のフォントです。
このCSSの設定を変えればよいのかもしれませんが、面倒なのでこのフォントを削除してしまうことにしましょう。
Windowsの場合、フォントを消す方法はコントロールパネル内の「フォント」項目から消すか、Windowsのフォルダから直接ファイルを消すことでフォントが消えます。
まぁ、結局どちらからでもほぼ同じですけど…。
コントロールパネルから消す場合は、コントロールパネルを開いて左側にあるペインから「クラシック表示に切り替える」を選択してから一覧内の「フォント」をダブルクリックします。
すでにクラシック表示の場合はそのまま「フォント」を開きます。
ちなみに、左側のペインに「クラシック表示に切り替える」や「カテゴリの表示に切り替える」が表示されていない場合はレジストリを書き換えて直しましょう。
スタートメニューから「ファイルを指定して実行」を選択し、表示されたダイアログに「regedit」と入力してレジストリエディタを立ち上げます。
階層表示のトップから以下の場所まで辿って行きます。
HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Policies\Explorer
右側の一覧内に「ForceClassicControlPanel」という項目があったら削除します。
ちなみに、この項目の値が「0」の場合はカテゴリ表示に固定され、「1」の場合はクラシック表示に固定されます。
話しを戻してフォント削除。
削除するフォントは以下の2つです。
「Lucida Grande (True Type) 」
「Lucida GrandeBold (True Type) 」
この2つを一覧内から探し削除します。
似ている名前のフォントがいくつかあるので間違えないようにしましょう。
Windowsフォルダから消す方法はC:\WINDOWS\Fontsフォルダから上記のフォント2つをけすだけです。
システムのフォルダを直接操作したくない人は上記の方法で消しましょう。
これで文字化けは解消されているはずです。
やっと安心してニュースや番組情報が見られますね!
ここまで--------------------------------------------------
さあ!これでこのブログも安心して読めるぜ(爆)
役に立ったという方は【ココ】をクリック!
役に立たなかったという方は【コチラ】をクリック!!!
つるとんたんでは必ずうどんを3玉頼みます。
けんとです。
▼つるとんたん
http://www.tsurutontan.co.jp/
さて、FireFoxをバージョンアップしたら
コロンと全角数字が文字化けじゃないか!
どうしてくれるんだ!って方へ。
▼OPUS MAGNUM
http://blog.goo.ne.jp/oko-bou
上記ブログに解決策がでておりましたので
ご紹介いたします。
ここから-------------------------------------------
バージョンアップで話題のFireFox。
結局、ブックマークが使いにくそうなので暫くはFireFox 2を使っていこうと思っています。
そのうちサポート外になってしまうのでしょうけど…。
で、ちょっと前から気になっていたFireFox 2での文字化けがおきている件。
どうせ文字エンコーディングがおかしいのだろうとあまり気にしていませんでした。
化ける文字は全角の数字とコロンのようです。
この文字化けが発生するとニュースサイトを見ていると人の年齢が文字化けしていたり、番組欄を見ていると何時から放送されるのか全然わからなかったり大変です。
全角数字を使わなければ良いのですが、それはページの作成者が決めることですから仕方がありませんね。
すごく気になるのがNHK BSの番組紹介サイトです。
このページを見ると文字化けが目立ちます。
で、さすがに最近あまりに気になるのでちょっと調べてみました。
どうやら原因はFireFoxにあるようで、CSSの設定でフォントの指定が悪いようです。
元凶となるフォントは「Lucida Grande」という名前のフォントです。
このCSSの設定を変えればよいのかもしれませんが、面倒なのでこのフォントを削除してしまうことにしましょう。
Windowsの場合、フォントを消す方法はコントロールパネル内の「フォント」項目から消すか、Windowsのフォルダから直接ファイルを消すことでフォントが消えます。
まぁ、結局どちらからでもほぼ同じですけど…。
コントロールパネルから消す場合は、コントロールパネルを開いて左側にあるペインから「クラシック表示に切り替える」を選択してから一覧内の「フォント」をダブルクリックします。
すでにクラシック表示の場合はそのまま「フォント」を開きます。
ちなみに、左側のペインに「クラシック表示に切り替える」や「カテゴリの表示に切り替える」が表示されていない場合はレジストリを書き換えて直しましょう。
スタートメニューから「ファイルを指定して実行」を選択し、表示されたダイアログに「regedit」と入力してレジストリエディタを立ち上げます。
階層表示のトップから以下の場所まで辿って行きます。
HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Policies\Explorer
右側の一覧内に「ForceClassicControlPanel」という項目があったら削除します。
ちなみに、この項目の値が「0」の場合はカテゴリ表示に固定され、「1」の場合はクラシック表示に固定されます。
話しを戻してフォント削除。
削除するフォントは以下の2つです。
「Lucida Grande (True Type) 」
「Lucida GrandeBold (True Type) 」
この2つを一覧内から探し削除します。
似ている名前のフォントがいくつかあるので間違えないようにしましょう。
Windowsフォルダから消す方法はC:\WINDOWS\Fontsフォルダから上記のフォント2つをけすだけです。
システムのフォルダを直接操作したくない人は上記の方法で消しましょう。
これで文字化けは解消されているはずです。
やっと安心してニュースや番組情報が見られますね!
ここまで--------------------------------------------------
さあ!これでこのブログも安心して読めるぜ(爆)
役に立ったという方は【ココ】をクリック!
役に立たなかったという方は【コチラ】をクリック!!!
07/08: ヌーブラ
06/28: 「うまい棒」の製造工場を全焼、原料も燃える 茨城
27日午後2時15分ごろ、茨城県常総市鴻野山、
菓子製造業「リスカ」(武藤則夫社長)の製造第3課工場から出火し、
鉄骨スレート葺き工場約1350平方メートルが全焼。
工場内の乾燥機やベルトコンベヤー、梱包(こんぽう)機などの製造機が焼け、
菓子の原料となるトウモロコシや食用油などが焼失した。
出火当時、工場内には約20人の従業員がいたが、全員避難しけが人はなかった。
常総署の調べによると、工場内でスナック菓子を乾かす
大乾燥機から煙が出ているのを従業員が発見、119番通報した。
同社はトウモロコシなどを原料とする
スナック菓子「うまい棒」や「ハートチップル」で知られ、
チョコレートやゼリー菓子などの製造販売も行っている。
同工場では「うまい棒」の“タコヤキ味”を製造していた。
同署で出火原因を調べている。
▼「うまい棒」の製造工場を全焼、原料も燃える 茨城
http://headlines.yahoo.co.jp/hl?a=20080628-00000014-maiall-soci
▼「うまい棒」タコヤキ味の製造工場で火災 茨城
http://headlines.yahoo.co.jp/hl?a=20080627-00000967-san-soci
会社名、「リスカ」って言うんだ、、、。
▼そんなリスカのHP
http://www.riska.co.jp/
菓子製造業「リスカ」(武藤則夫社長)の製造第3課工場から出火し、
鉄骨スレート葺き工場約1350平方メートルが全焼。
工場内の乾燥機やベルトコンベヤー、梱包(こんぽう)機などの製造機が焼け、
菓子の原料となるトウモロコシや食用油などが焼失した。
出火当時、工場内には約20人の従業員がいたが、全員避難しけが人はなかった。
常総署の調べによると、工場内でスナック菓子を乾かす
大乾燥機から煙が出ているのを従業員が発見、119番通報した。
同社はトウモロコシなどを原料とする
スナック菓子「うまい棒」や「ハートチップル」で知られ、
チョコレートやゼリー菓子などの製造販売も行っている。
同工場では「うまい棒」の“タコヤキ味”を製造していた。
同署で出火原因を調べている。
▼「うまい棒」の製造工場を全焼、原料も燃える 茨城
http://headlines.yahoo.co.jp/hl?a=20080628-00000014-maiall-soci
▼「うまい棒」タコヤキ味の製造工場で火災 茨城
http://headlines.yahoo.co.jp/hl?a=20080627-00000967-san-soci
会社名、「リスカ」って言うんだ、、、。
▼そんなリスカのHP
http://www.riska.co.jp/
06/17: もはや要塞である。
東京メトロ渋谷駅
http://www.tokyometro.jp/rosen/eki/shibuya/map_rittai_1.html
先日、僕も迷いました。
▼06/15: 今話題の副都心線に乗ってみた。
http://kobayashikento.com/item_326.html
このときですね。
もう少しわかりやすくならないもんか、、、。
http://www.tokyometro.jp/rosen/eki/shibuya/map_rittai_1.html
先日、僕も迷いました。
▼06/15: 今話題の副都心線に乗ってみた。
http://kobayashikento.com/item_326.html
このときですね。
もう少しわかりやすくならないもんか、、、。
05/21: ラスボス サチコ でGoogle検索
まじかよ。
ラスボス
ってキーワードでググると
小林幸子さんがtopにでてくる。

▼「ラスボス」Google画像検索トップ、なぜか小林幸子さん
http://www.itmedia.co.jp/news/articles/0805/20/news085.html
ラスボス
ってキーワードでググると
小林幸子さんがtopにでてくる。
▼「ラスボス」Google画像検索トップ、なぜか小林幸子さん
http://www.itmedia.co.jp/news/articles/0805/20/news085.html
05/06: ゴールデンウィーク最終日に、、、
発熱キターーーー(∩∀`)ーーーー!!
どうも。
最近、うどんの消費量が多いけんとです。
さて、ここをクリックしてもらえると俺のテンションとランキングが上がります。
よろしくお願いします。
俺の太りやすい理由がここに。
----------------------
同じ食事でも、夜型の生活時間に食べると朝型より食後の発熱量が少ないことが、
中村丁次神奈川県立保健福祉大教授らの研究で分かった。
夜型は太りやすいと言われるが、エネルギー消費の面から裏付けられた形。
5月2日から埼玉県で開かれる日本栄養・食糧学会で発表する。
食事を取ると、消化活動のため体温が上がり、エネルギーを消費する。
これをDIT(食事誘発性熱産生)といい、DITが高いほど太りにくい。
-----------------------
らしい。
まじか。
朝型のITか。
でも、当然のことだけど
「働く」ってことがすべてじゃないですもんね。
今の生活は、人間的にダメになってきている気がします(笑)
最近、うどんの消費量が多いけんとです。
さて、ここをクリックしてもらえると俺のテンションとランキングが上がります。
よろしくお願いします。
俺の太りやすい理由がここに。
----------------------
同じ食事でも、夜型の生活時間に食べると朝型より食後の発熱量が少ないことが、
中村丁次神奈川県立保健福祉大教授らの研究で分かった。
夜型は太りやすいと言われるが、エネルギー消費の面から裏付けられた形。
5月2日から埼玉県で開かれる日本栄養・食糧学会で発表する。
食事を取ると、消化活動のため体温が上がり、エネルギーを消費する。
これをDIT(食事誘発性熱産生)といい、DITが高いほど太りにくい。
-----------------------
らしい。
まじか。
朝型のITか。
でも、当然のことだけど
「働く」ってことがすべてじゃないですもんね。
今の生活は、人間的にダメになってきている気がします(笑)