搜索引擎关键词优化问题研究

2016-12-06 12:06刘林李艺
中国市场 2016年32期
关键词:搜索引擎词语文章

刘林+李艺

[摘 要]文章描述一种搜索竞价广告关键词的优化方式,该方式可以精准地提取推广信息中的关键词,进而为广告主创造更大的经济成效。文章细致剖析这部分经济要素并且选取当中对于竞价关键词作用最显著的要素当作优化特点,用作成果的改善,主要凭借对关键词的抽取进行改善。对于此类关键词计算方式的改善目的在于为使用者确立的竞价广告推送众多有关的关键词,帮助企业获取更高的点击率。

[关键词]搜索引擎优化;关键词广告;SEO

[DOI]10.13939/j.cnki.zgsc.2016.32.159

1 引 言

互联网的迅速发展,带动了互联网信息的膨胀,其商业价值也被人们所发掘。更多的行业将信息投放到网络当中,希望通过搜索引擎广告或其他类型广告被发现,以低成本带来可观的收益。这其中的搜索引擎优化则是目前来看最为主流和有效的广告推广形式,大部分企业都青睐这一方式。

我国搜索引擎行业已经比较成熟。搜索引擎关键词搜索成为企业主要关注的领域。为了能够给企业带来更好的推广效益,需要及时更新搜索引擎营销,来适应当前的网络环境,满足客户的需求。这就需要时刻对行业情况以及搜索引擎的抓取方式进行分析,为商家带来更多的商机。

2 关键词提取相关文献述评

2.1 关键词提取方法

目前,市场上主流的关键词提取方法主要包括:启发式原则提取文本当中的关键词,借助于无监管学习方式来提取关键词,以自动标示文献主题为基础的提取方式,以词语网络为基础的关键词提取方式等。

2.2 存在的问题

虽然关键词提取方式众多,不过都存在着或大或小的缺陷,比如: 一般的提取方式是为文本产生可以表示其主旨的关键词,但是搜索竞价广告关键词优化的目标却没有这么简单,任何可能会引导用户进入企业网址的词汇都应纳入候选目标当中。还有,关键词产生范畴存在差别。一般的提取方式均提取特定文本当中的关键词,但是搜索竞价广告关键词优化方式产生的关键词仅有极少数显现在推广信息当中,剩余的均依据计算方式的设置在别的材料当中体现。

为了能够解决方法存在的一些问题,本文以搜索广告的特征为基础推出一种提取方式来产生种子关键词。

3 种子关键词生成

3.1 问题分析

搜索广告种子关键词提取要获取的结果是一批和主旨存在关联的关键词,这类词语当中输入方,参加到之后的环节当中。

3.2 模型简介

这种方式是以序列模式发掘为基础的。序列模式发掘属于速度较快的一类方式。文章选用的是以这一方式为基础的迭代法来发掘语言模式及提取关键词。这一以模式发掘为基础的关键词提取模型的操作流程简单地介绍如下:其一是选出一批备选的关键词当作种子并且运用序列模式发掘的计算方式以选出的关键词为基础来选择关键词的模式,其二为运用语言模式提取关键词。此次迭代获得的关键词将会当作下一轮迭代首个步骤的输入来发掘接下来的语言模式。这一迭代流程重复操作直至不再产生全新的语言模式。

文章将广告文本处置成数个语句的集合,关键词是可以表现语句主旨的单词。语言模式是和关键词紧密相联的词序。比如:在例句“店铺出售鲜花”当中,“鲜花”便是关键词,词序“店铺出售”便是语言模式。

3.3 语言模式挖掘

3.3.1 初始关键词选择

这种算法第一步便是要选取一批最初的关键词用作发掘最初的语言模式。文章指出,ODP 的目录名能够被选定成最初的关键词集合。可是这种目录名无法涉及全部的关键词,因而这一算法必须持续地迭代,从而发掘出全新的关键词。

3.3.2 语料预处理

在展开语言模式发掘以前,最初的语料库必须展开预先处置,文章将预先处置的全部程序表述为:

(1)运用文本预先处置的方式对其展开预先处置,这类的活动包含中文分词处置、词句分离、量词消除等。

(2)利用来更换关键词表格当中的词语。比如,若关键词表格当中包括“鲜花” 一词,则语句“买鲜花赠人”将会被修正成“买赠人”。展开这类更换的诱因在于经过这种更换能够提取更为丰富的关键词。若运用上面的模式和语句“买手机赠人”展开配置,则“手机”将会被当作关键词而提出。

3.3.3 序列模式挖掘算法

文章将语句视为词语的集合,因为采用序列模式发掘的方式来提取语言模式。

文章把全部的序列按照元组来划分并且存进数据库,元组呈现成< sid,s>,在这当中 sid 是序列的标记,s 是属于该元组内的某个词语集序列。若序列α属于s的子集,那么便说s 包含α。文章把序列α的支撑度界定成数据库S当中包含α的元组的数量,其具体可阐释为:

Support(α)=|{ |(∈S)∧(α∈s)}|

若Support(α)超过了设置的阈值,便将α当作模式。

序列模式发掘方式的目的是寻找相应数据库当中全部的模式。在文章的语言发掘方式当中序列属于文本预先处置流程当中的分段,序列中的要素便是分段中的词语。

3.3.4 模式匹配

语言模式发掘方式产生的语言模式将用作配置语料库从而产生全新的关键词。若某个词语或是短句在发掘的语言模式当中有所表现而且处在的位置,则这一词语将会被选定成关键词。比如:语言模式: “喜爱”。若语料库当中的某个语句为“年轻的姑娘都非常喜爱玫瑰花”,便选取“玫瑰花”当作关键词。文章借助于模式配置来提取文档当中的关键词。

4 结 论

搜索竞价广告关键词优化力争为在搜索引擎中投送推广信息的人群供应最佳的关键词选取规划,从而帮助其获取更高限度的经济利益,并且促使其脱离繁杂的人工操作阶段,有力地给予他们科学引导。因而,对其的探究具有极大的运用价值。

本文给出了一种广告关键词抽取算法用于抽取广告中的关键词。该算法首先利用序列模式挖掘算法抽取语料库中的语言模式,然后利用抽取得到的语言模式库对广告进行关键词抽取。这种算法克服了传统的基于统计信息的关键词抽取算法在广告关键词抽取领域中的不足,其抽取结果的准确率和查全率都有很大提升。

参考文献:

[1]丁银芳.基于Web日志挖掘的个性化推荐原型系统研究与实现[D].南京:南京农业大学,2009.

[2]张建娥.基于TFIDF和词语关联度的中文关键词提取方法[J].业务研究,2012(10).

[3]冯佳佳.基于序列模式挖掘的关键词抽取问题研究[D].合肥:合肥工业大学,2012.

[4]刘建毅,王箐华,王枞.基于语言网络的关键词抽取[C].北京:第三届全国信息检索与内容安全学术会议论文集,2007:161-168.

猜你喜欢
搜索引擎词语文章
容易混淆的词语
细致入微的描写让文章熠熠生辉
放屁文章
小处着眼,写大文章
网络搜索引擎亟待规范
一枚词语一门静
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析