(使用できない単語)ERROR:PoiDescription contains one or more banned words について

これは、誤検知をする理由もわからなくないので仕方ないとも言えるのですが、ポータルの説明文を編集しているときに、特に問題がないと思える文章を入力して送信したところ
ERROR:PoiDescription contains one or more banned words
(説明文にひとつまたはいくつか使用できない単語が含まれている)
がでてしまい、理由がわからず結構時間をかけていろいろ試したところでわかりました・・・
例として「~を待つばかりである」という文章にそれは含まれていて、
空白を入れて「~を待つば かりである」としてみたのだが使用できない単語として検知されてしまい、
「~を待つばカりである」と「か」をカタカナの「カ」にしたところ送信可能になりました。そのほかに妥当な回避方法があるかもしれませんが・・・
理由を知らないと不自然な表記ですが、言い換えの利かないような内容(固有の名称や俳句の内容などに含まれている場合)は上記のような回避をする以外には対処が難しいと感じました。
文章の内容から「そういう意味では使用していない」とは残念ながらプログラムには通用せず、文章に関係なく文字単位で認識しているのでこうなるのだと想像しますが、逆に書いてる人間には意識の外で気が付きにくいので、エラーの理由がわからない、という人もいるのではないかと思いました。この件について特に他で見つけられなかったので(具体例を出せないのもわかるが・・)私のように全く意識の外で最初それに気が付かないという人には役立つかもしれないと思い記します。
」
0
コメント
現在、ポータルにかかわるモノについてはすべてIngressチームから離れてしまったため、Ingressチームがこれらを修正する権限をもっているのか不明ですが、英語はもちろん英語以外の禁止用語はとても貧弱です。
特に日本語は、漢字、ひらがな、カタカナが混じり、文節によっては間に禁止用語に抜き出せるものもあるため改善を望みたいです。
私がひっかかった禁止用語も実にバカバカしいものでした。
×「勉学にはげむ」
〇「勉学に励む」
これのどこに禁止用語があるかというと、~に「はげ」む、です。
つまり、禿げととらえられて禁止用語になっています。
漢字にすると大丈夫でした。
ただ、こう考えると、たとえば「禿鷲のオブジェ」があった場合、まちがいなく禁止用語とひっかかるでしょう。
おそらくこの場合だと、禿鷲、はげわし、ハゲワシ。すべてダメとなり「鷲のオブジェ」でしか通らないでしょう。
これは他人から聞いた話でしが、「〇〇ニガー」という沖縄の地名が「ニガー」という言葉だけ抽出されて禁止用語となったことからノミネート出来ませんでした。
まあ、ここも同様になる可能性はあるので***がたくさんあったら禁止用語にひっかかったと思ってください。
ああ、そういう単語も引っかかるんですね(書いてる側は意図してないとはいえ)。次そういうのに引っかかった時に、それらはヒントになりそうです。(誤検出のほうを改善できないなら)それらを一覧にしたらいいんでしょうけど、そもそも具体例を列挙したら、それはそれで問題になるよう気がするのでできませんが・・でも、そういう観点が持てれば原因を見つけやすいので参考になります。