docs/jgtextrank.html

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html><head><title>Python: module jgtextrank.__init__</title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head><body bgcolor="#f0f0f8">

<table width="100%" cellspacing=0 cellpadding=2 border=0 summary="heading">
<tr bgcolor="#7799ee">
<td valign=bottom>&nbsp;<br>
<font color="#ffffff" face="helvetica, arial">&nbsp;<br><big><big><strong><a href="jgtextrank.html"><font color="#ffffff">jgtextrank</font></a>.__init__</strong></big></big> (version 0.1.3)</font></td
><td align=right valign=bottom
><font color="#ffffff" face="helvetica, arial"><a href=".">index</a><br><a href="file:c%3A%5Coak-project%5Cpython%5Cgithub%5Cjgtextrank%5Cjgtextrank%5C__init__.py">c:\oak-project\python\github\jgtextrank\jgtextrank\__init__.py</a></font></td></tr></table>
    <p><tt>jgtextrank:&nbsp;Yet&nbsp;another&nbsp;Python&nbsp;implementation&nbsp;of&nbsp;TextRank<br>
==================================<br>
&nbsp;<br>
jgtextrank&nbsp;is&nbsp;a&nbsp;Python&nbsp;package&nbsp;for&nbsp;the&nbsp;creation,&nbsp;manipulation,&nbsp;and&nbsp;study&nbsp;of&nbsp;TextRank&nbsp;algorithm,&nbsp;a&nbsp;graph&nbsp;based&nbsp;keywords&nbsp;extraction&nbsp;and&nbsp;summarization&nbsp;approach<br>
&nbsp;<br>
&nbsp;<br>
Website&nbsp;(including&nbsp;documentation)::<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;https://github.com/jerrygaoLondon/jgtextrank<br>
&nbsp;<br>
Source::<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;https://github.com/jerrygaoLondon/jgtextrank<br>
&nbsp;<br>
Bug&nbsp;reports::<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;https://github.com/jerrygaoLondon/jgtextrank/issues<br>
&nbsp;<br>
Simple&nbsp;example<br>
--------------<br>
Extract&nbsp;weighted&nbsp;keywords&nbsp;with&nbsp;an&nbsp;undirected&nbsp;graph::<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;from&nbsp;jgtextrank&nbsp;import&nbsp;keywords_extraction<br>
&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;example_abstract&nbsp;=&nbsp;"Compatibility&nbsp;of&nbsp;systems&nbsp;of&nbsp;linear&nbsp;constraints&nbsp;over&nbsp;the&nbsp;set&nbsp;of&nbsp;natural&nbsp;numbers.&nbsp;"&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"Criteria&nbsp;of&nbsp;compatibility&nbsp;of&nbsp;a&nbsp;system&nbsp;of&nbsp;linear&nbsp;Diophantine&nbsp;equations,&nbsp;strict&nbsp;inequations,&nbsp;"&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"and&nbsp;nonstrict&nbsp;inequations&nbsp;are&nbsp;considered.&nbsp;Upper&nbsp;bounds&nbsp;for&nbsp;components&nbsp;of&nbsp;a&nbsp;minimal&nbsp;set&nbsp;of&nbsp;"&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"solutions&nbsp;and&nbsp;algorithms&nbsp;of&nbsp;construction&nbsp;of&nbsp;minimal&nbsp;generating&nbsp;sets&nbsp;of&nbsp;solutions&nbsp;for&nbsp;all&nbsp;"&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"types&nbsp;of&nbsp;systems&nbsp;are&nbsp;given.&nbsp;These&nbsp;criteria&nbsp;and&nbsp;the&nbsp;corresponding&nbsp;algorithms&nbsp;for&nbsp;"&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"constructing&nbsp;a&nbsp;minimal&nbsp;supporting&nbsp;set&nbsp;of&nbsp;solutions&nbsp;can&nbsp;be&nbsp;used&nbsp;in&nbsp;solving&nbsp;all&nbsp;the&nbsp;"&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"considered&nbsp;types&nbsp;systems&nbsp;and&nbsp;systems&nbsp;of&nbsp;mixed&nbsp;types."<br>
&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;<a href="#-keywords_extraction">keywords_extraction</a>(example_abstract,&nbsp;top_p&nbsp;=&nbsp;1,&nbsp;directed=False,&nbsp;weight_comb="sum")[0][:15]<br>
&nbsp;&nbsp;&nbsp;&nbsp;[('linear&nbsp;diophantine&nbsp;equations',&nbsp;0.18059),&nbsp;('minimal&nbsp;supporting&nbsp;set',&nbsp;0.16649),&nbsp;('minimal&nbsp;set',&nbsp;0.13201),&nbsp;('types&nbsp;systems',&nbsp;0.1194),&nbsp;('linear&nbsp;constraints',&nbsp;0.10997),&nbsp;('strict&nbsp;inequations',&nbsp;0.08832),&nbsp;('systems',&nbsp;0.08351),&nbsp;('corresponding&nbsp;algorithms',&nbsp;0.0767),&nbsp;('nonstrict&nbsp;inequations',&nbsp;0.07276),&nbsp;('mixed&nbsp;types',&nbsp;0.07178),&nbsp;('set',&nbsp;0.06674),&nbsp;('minimal',&nbsp;0.06527),&nbsp;('natural&nbsp;numbers',&nbsp;0.06466),&nbsp;('algorithms',&nbsp;0.05479),&nbsp;('solutions',&nbsp;0.05085)]<br>
&nbsp;<br>
&nbsp;<br>
License<br>
-------<br>
&nbsp;<br>
Released&nbsp;under&nbsp;the&nbsp;MIT&nbsp;License::<br>
&nbsp;<br>
Copyright&nbsp;(C)&nbsp;2017,&nbsp;JIE&nbsp;GAO&nbsp;&lt;j.gao@sheffield.ac.uk&gt;</tt></p>
<p>
<table width="100%" cellspacing=0 cellpadding=2 border=0 summary="section">
<tr bgcolor="#eeaa77">
<td colspan=3 valign=bottom>&nbsp;<br>
<font color="#ffffff" face="helvetica, arial"><big><strong>Functions</strong></big></font></td></tr>
    
<tr><td bgcolor="#eeaa77"><tt>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</tt></td><td>&nbsp;</td>
<td width="100%"><dl><dt><a name="-build_cooccurrence_graph"><strong>build_cooccurrence_graph</strong></a>(preprocessed_context:Generator[Tuple[List[str], List[Tuple[str, str]]], NoneType, NoneType], directed:bool=False, weighted:bool=False, conn_with_original_ctx=True, window:int=2) -&gt; Tuple[networkx.classes.graph.Graph, List[List[str]]]</dt><dd><tt>build&nbsp;cooccurrence&nbsp;graph&nbsp;from&nbsp;filtered&nbsp;context<br>
and&nbsp;only&nbsp;consider&nbsp;single&nbsp;words&nbsp;as&nbsp;candidates&nbsp;for&nbsp;addition&nbsp;to&nbsp;the&nbsp;graph<br>
&nbsp;<br>
prepare&nbsp;vertex&nbsp;representation&nbsp;-&gt;&nbsp;add&nbsp;vertex&nbsp;&gt;&nbsp;add&nbsp;edges<br>
&nbsp;<br>
For&nbsp;directed&nbsp;or&nbsp;undirected,&nbsp;the&nbsp;conclusion&nbsp;of&nbsp;the&nbsp;paper&nbsp;is&nbsp;that&nbsp;"no&nbsp;'direction'&nbsp;that&nbsp;can&nbsp;be&nbsp;established&nbsp;between<br>
co-occurring&nbsp;words."<br>
&nbsp;<br>
:type&nbsp;preprocessed_context:&nbsp;generator&nbsp;or&nbsp;list/iterable<br>
:param&nbsp;preprocessed_context:&nbsp;a&nbsp;tuple&nbsp;list&nbsp;of&nbsp;tokenised&nbsp;and&nbsp;PoS&nbsp;tagged&nbsp;text&nbsp;filtered&nbsp;by&nbsp;syntactic&nbsp;filter<br>
:type&nbsp;directed:&nbsp;bool<br>
:type&nbsp;weighted:&nbsp;bool.&nbsp;Not&nbsp;supported&nbsp;yet<br>
:param&nbsp;directed:&nbsp;default&nbsp;as&nbsp;False,&nbsp;best&nbsp;results&nbsp;observed&nbsp;with&nbsp;undirected&nbsp;graph;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;:TODO:&nbsp;for&nbsp;directed&nbsp;graph,&nbsp;not&nbsp;fully&nbsp;supported&nbsp;yet&nbsp;and&nbsp;need&nbsp;to&nbsp;define&nbsp;forward&nbsp;co-occurrence&nbsp;and&nbsp;backward&nbsp;co-occurrence<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;For&nbsp;directed&nbsp;graph,&nbsp;a&nbsp;direction&nbsp;should&nbsp;be&nbsp;set&nbsp;following&nbsp;the&nbsp;natural&nbsp;flow&nbsp;of&nbsp;the&nbsp;text<br>
:type&nbsp;conn_with_original_ctx:&nbsp;bool<br>
:param&nbsp;conn_with_original_ctx:&nbsp;True&nbsp;if&nbsp;checking&nbsp;two&nbsp;vertices&nbsp;co-occurrence&nbsp;link&nbsp;from&nbsp;original&nbsp;context<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else&nbsp;checking&nbsp;connections&nbsp;from&nbsp;filtered&nbsp;context<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;More&nbsp;vertices&nbsp;connection&nbsp;can&nbsp;be&nbsp;built&nbsp;if&nbsp;'conn_with_original_ctx'&nbsp;is&nbsp;set&nbsp;to&nbsp;False<br>
:type&nbsp;window:&nbsp;int<br>
:param&nbsp;window:&nbsp;a&nbsp;window&nbsp;of&nbsp;N&nbsp;words<br>
:rtype:&nbsp;tuple[of&nbsp;[nx.graph,&nbsp;list]]<br>
:return:&nbsp;(networkx)&nbsp;graph&nbsp;object&nbsp;readily&nbsp;to&nbsp;score&nbsp;along&nbsp;with&nbsp;all&nbsp;tokenised&nbsp;raw&nbsp;text&nbsp;splitted&nbsp;by&nbsp;context</tt></dd></dl>
 <dl><dt><a name="-compute_TeRGraph"><strong>compute_TeRGraph</strong></a>(term_graph:networkx.classes.graph.Graph) -&gt; Dict[str, float]</dt><dd><tt>compute&nbsp;graph&nbsp;vertices&nbsp;with&nbsp;TeRGraph&nbsp;algorithms<br>
&nbsp;<br>
This&nbsp;algorithm&nbsp;is&nbsp;based&nbsp;on&nbsp;the&nbsp;assumption&nbsp;that&nbsp;term&nbsp;representativeness&nbsp;in&nbsp;a&nbsp;graph&nbsp;for&nbsp;a&nbsp;specific&nbsp;domain&nbsp;depends&nbsp;on<br>
the&nbsp;number&nbsp;of&nbsp;neighbors&nbsp;that&nbsp;it&nbsp;has,&nbsp;and&nbsp;the&nbsp;number&nbsp;of&nbsp;neighbors&nbsp;of&nbsp;its&nbsp;neighbors.&nbsp;A&nbsp;term&nbsp;with&nbsp;more&nbsp;neighbors&nbsp;is<br>
less&nbsp;representative&nbsp;of&nbsp;the&nbsp;specific&nbsp;domain.<br>
&nbsp;<br>
Original&nbsp;paper&nbsp;requires&nbsp;a&nbsp;connected&nbsp;graph&nbsp;and&nbsp;this&nbsp;method&nbsp;will&nbsp;set&nbsp;isolated&nbsp;nodes&nbsp;to&nbsp;0&nbsp;(by&nbsp;default).<br>
&nbsp;<br>
Lossio-Ventura,&nbsp;J.&nbsp;A.,&nbsp;Jonquet,&nbsp;C.,&nbsp;Roche,&nbsp;M.,&nbsp;&amp;&nbsp;Teisseire,&nbsp;M.&nbsp;(2014,&nbsp;September).<br>
&nbsp;&nbsp;&nbsp;&nbsp;Yet&nbsp;another&nbsp;ranking&nbsp;function&nbsp;for&nbsp;automatic&nbsp;multiword&nbsp;term&nbsp;extraction.<br>
&nbsp;&nbsp;&nbsp;&nbsp;In&nbsp;International&nbsp;Conference&nbsp;on&nbsp;Natural&nbsp;Language&nbsp;Processing&nbsp;(pp.&nbsp;52-64).&nbsp;Springer,&nbsp;Cham.<br>
&nbsp;<br>
:param&nbsp;term_graph:&nbsp;NetworkX&nbsp;graph<br>
:return:&nbsp;dict,&nbsp;all&nbsp;nodes&nbsp;weighted&nbsp;with&nbsp;TeRGraph&nbsp;metric</tt></dd></dl>
 <dl><dt><a name="-compute_neighborhood_size"><strong>compute_neighborhood_size</strong></a>(term_cooccur_graph) -&gt; Dict[str, int]</dt><dd><tt>Number&nbsp;of&nbsp;immediate&nbsp;neighbors&nbsp;to&nbsp;a&nbsp;node<br>
&nbsp;<br>
a&nbsp;version&nbsp;of&nbsp;node&nbsp;degree&nbsp;that&nbsp;disregards&nbsp;self-loops&nbsp;(e.g.,&nbsp;"again,&nbsp;again,&nbsp;again")<br>
&nbsp;<br>
:param&nbsp;term_graph:&nbsp;NetworkX&nbsp;graph<br>
:return:&nbsp;dict,&nbsp;all&nbsp;nodes&nbsp;weighted&nbsp;with&nbsp;neighborhood&nbsp;size</tt></dd></dl>
 <dl><dt><a name="-keywords_extraction"><strong>keywords_extraction</strong></a>(text:str, window:int=2, top_p:float=1, top_t:Union[int, NoneType]=None, directed:bool=False, weighted:bool=False, conn_with_original_ctx:bool=True, syntactic_categories:Set[str]={'NNP', 'JJ', 'NNS', 'NN'}, stop_words:Set[str]=None, lemma:bool=False, solver:str='pagerank', max_iter:int=100, tol:float=1e-06, weight_comb:str='norm_max', mu:int=5, workers:int=1)</dt><dd><tt>TextRank&nbsp;keywords&nbsp;extraction&nbsp;for&nbsp;unstructured&nbsp;text<br>
&nbsp;<br>
:type&nbsp;text:&nbsp;string,&nbsp;required<br>
:param&nbsp;text:&nbsp;textual&nbsp;data&nbsp;for&nbsp;keywords&nbsp;extraction<br>
:type&nbsp;window:&nbsp;int,&nbsp;required<br>
:param&nbsp;window:&nbsp;co-occurrence&nbsp;window&nbsp;size&nbsp;(default&nbsp;with&nbsp;forward&nbsp;and&nbsp;backward&nbsp;context).&nbsp;Recommend:&nbsp;2-10<br>
:type&nbsp;top_t:&nbsp;int&nbsp;or&nbsp;None,&nbsp;optional<br>
:param&nbsp;top_t:&nbsp;the&nbsp;top&nbsp;T&nbsp;vertices&nbsp;in&nbsp;the&nbsp;ranking&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Top&nbsp;T&nbsp;is&nbsp;computed&nbsp;from&nbsp;Top&nbsp;p&nbsp;if&nbsp;value&nbsp;is&nbsp;none<br>
:type&nbsp;top_p:&nbsp;float&nbsp;or&nbsp;None,&nbsp;optional<br>
:param&nbsp;top_p:&nbsp;the&nbsp;top&nbsp;Percentage(P)&nbsp;of&nbsp;vertices&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Top&nbsp;1/3&nbsp;of&nbsp;all&nbsp;vertices&nbsp;is&nbsp;recommended&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;directed:&nbsp;bool,&nbsp;required<br>
:param&nbsp;directed:&nbsp;directed&nbsp;or&nbsp;undirected&nbsp;graph&nbsp;(a&nbsp;preserved&nbsp;parameters)<br>
:type&nbsp;weighted:&nbsp;bool,&nbsp;optional<br>
:param&nbsp;weighted:&nbsp;weighted&nbsp;or&nbsp;unweighted,&nbsp;Custom&nbsp;weighted&nbsp;graph&nbsp;is&nbsp;not&nbsp;supported&nbsp;yet,&nbsp;Default&nbsp;as&nbsp;False<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;unweighted&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper<br>
&nbsp;<br>
:type&nbsp;conn_with_original_ctx:&nbsp;bool,&nbsp;optional<br>
:param&nbsp;conn_with_original_ctx:&nbsp;whether&nbsp;build&nbsp;vertices&nbsp;connections&nbsp;from&nbsp;original&nbsp;context&nbsp;or&nbsp;filtered&nbsp;context,<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;True&nbsp;if&nbsp;checking&nbsp;two&nbsp;vertices&nbsp;co-occurrence&nbsp;link&nbsp;from&nbsp;original&nbsp;context,<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else&nbsp;checking&nbsp;connections&nbsp;from&nbsp;filtered&nbsp;context&nbsp;by&nbsp;syntactic&nbsp;rule<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;More&nbsp;vertices&nbsp;connections&nbsp;can&nbsp;be&nbsp;built&nbsp;if&nbsp;'conn_with_original_ctx'&nbsp;is&nbsp;set&nbsp;to&nbsp;False<br>
:type&nbsp;syntactic_categories:&nbsp;set&nbsp;[of&nbsp;string],&nbsp;required<br>
:param&nbsp;syntactic_categories:&nbsp;Default&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Syntactic&nbsp;categories&nbsp;(default&nbsp;as&nbsp;Part-Of-Speech(PoS)&nbsp;tags)&nbsp;is&nbsp;defined&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;filter&nbsp;accepted&nbsp;graph&nbsp;vertices&nbsp;(default&nbsp;with&nbsp;word-based&nbsp;tokens&nbsp;as&nbsp;single&nbsp;syntactic&nbsp;unit).<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Any&nbsp;word&nbsp;that&nbsp;is&nbsp;not&nbsp;matched&nbsp;with&nbsp;the&nbsp;predefined&nbsp;categories&nbsp;will&nbsp;be&nbsp;removed&nbsp;based&nbsp;on&nbsp;corresponding&nbsp;the&nbsp;PoS&nbsp;tag.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories&nbsp;only&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;stop_words:&nbsp;set&nbsp;of&nbsp;[string&nbsp;{‘english’}],&nbsp;or&nbsp;None&nbsp;(default),&nbsp;Optional<br>
:param&nbsp;stop_words:&nbsp;&nbsp;remove&nbsp;stopwords&nbsp;from&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;(token&nbsp;tuple&nbsp;list).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;stop&nbsp;words&nbsp;are&nbsp;considered&nbsp;as&nbsp;noisy&nbsp;common/function&nbsp;words.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;provide&nbsp;a&nbsp;list&nbsp;of&nbsp;stop&nbsp;words&nbsp;can&nbsp;improve&nbsp;vertices&nbsp;network&nbsp;connectivity<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;increase&nbsp;weights&nbsp;to&nbsp;more&nbsp;meaningful&nbsp;words.<br>
:type&nbsp;lemma:&nbsp;bool<br>
:param&nbsp;lemma:&nbsp;if&nbsp;lemmatize&nbsp;text<br>
:type&nbsp;solver:&nbsp;string,&nbsp;optional<br>
:param&nbsp;solver:&nbsp;{'pagerank',&nbsp;'pagerank_numpy',&nbsp;'pagerank_scipy',&nbsp;'betweenness_centrality',&nbsp;'degree_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'hits',&nbsp;'closeness_centrality',&nbsp;'edge_betweenness_centrality',&nbsp;'eigenvector_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'katz_centrality',&nbsp;'communicability_betweenness',&nbsp;'current_flow_closeness',&nbsp;'current_flow_betweenness',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'edge_current_flow_betweenness',&nbsp;'load_centrality',&nbsp;'clustering_coefficient',&nbsp;'TeRGraph',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'coreness',&nbsp;'neighborhood_size'},&nbsp;default&nbsp;'pagerank'<br>
&nbsp;&nbsp;&nbsp;&nbsp;PageRank&nbsp;Algorithms&nbsp;supported&nbsp;in&nbsp;networkx&nbsp;to&nbsp;use&nbsp;in&nbsp;the&nbsp;vertices&nbsp;ranking.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'pagerank'&nbsp;networkx&nbsp;pagerank&nbsp;implementation<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'pagerank_numpy'&nbsp;numpy&nbsp;pagerank&nbsp;implementation<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'pagerank_scipy'&nbsp;scipy&nbsp;pagerank&nbsp;implementation<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'betweenness_centrality'&nbsp;computes&nbsp;the&nbsp;shortest-path&nbsp;betweenness&nbsp;centrality&nbsp;of&nbsp;a&nbsp;node<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'degree_centrality'&nbsp;computes&nbsp;the&nbsp;degree&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'hits'&nbsp;computes&nbsp;HITS&nbsp;algorithm&nbsp;for&nbsp;a&nbsp;node.&nbsp;The&nbsp;avg.&nbsp;of&nbsp;Authority&nbsp;value&nbsp;and&nbsp;Hub&nbsp;value&nbsp;is&nbsp;computed<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'closeness_centrality'&nbsp;computes&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_betweenness_centrality'&nbsp;computes&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Maximum&nbsp;edge&nbsp;betweenness&nbsp;value&nbsp;in&nbsp;all&nbsp;the&nbsp;possible&nbsp;edge&nbsp;pairs&nbsp;is&nbsp;adopted&nbsp;for&nbsp;each&nbsp;vertex<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'eigenvector_centrality'&nbsp;computes&nbsp;the&nbsp;eigenvector&nbsp;centrality&nbsp;for&nbsp;the&nbsp;cooocurrence&nbsp;graph.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'katz_centrality'&nbsp;computes&nbsp;the&nbsp;Katz&nbsp;centrality&nbsp;for&nbsp;the&nbsp;nodes&nbsp;based&nbsp;on&nbsp;the&nbsp;centrality&nbsp;of&nbsp;its&nbsp;neighbors.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'communicability_betweenness'&nbsp;computes&nbsp;subgraph&nbsp;communicability&nbsp;for&nbsp;all&nbsp;pairs&nbsp;of&nbsp;nodes<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_closeness'&nbsp;computes&nbsp;current-flow&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'load_centrality'&nbsp;computes&nbsp;edge&nbsp;load.&nbsp;This&nbsp;is&nbsp;a&nbsp;experimental&nbsp;algorithm&nbsp;in&nbsp;nextworkx<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;that&nbsp;counts&nbsp;the&nbsp;number&nbsp;of&nbsp;shortest&nbsp;paths&nbsp;which&nbsp;cross&nbsp;each&nbsp;edge.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'clustering_coefficient'&nbsp;computes&nbsp;the&nbsp;clustering&nbsp;coefficient&nbsp;for&nbsp;nodes.&nbsp;Only&nbsp;undirected&nbsp;graph&nbsp;is&nbsp;supported.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'TeRGraph':&nbsp;computes&nbsp;the&nbsp;TeRGraph&nbsp;(Lossio-Ventura,&nbsp;2014)&nbsp;weights&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;solver&nbsp;requires&nbsp;a&nbsp;connected&nbsp;graph&nbsp;and&nbsp;isolated&nbsp;nodes&nbsp;will&nbsp;be&nbsp;set&nbsp;to&nbsp;0.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'coreness'&nbsp;(Batagelj&nbsp;&amp;&nbsp;Zaversnik,&nbsp;2003)&nbsp;measures&nbsp;how&nbsp;"deep"&nbsp;a&nbsp;node(word/phrase)&nbsp;is&nbsp;in&nbsp;the&nbsp;co-occurrence&nbsp;network.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;indicates&nbsp;how&nbsp;strongly&nbsp;the&nbsp;node&nbsp;is&nbsp;connected&nbsp;to&nbsp;the&nbsp;network.&nbsp;The&nbsp;"deeper"&nbsp;a&nbsp;word,&nbsp;the&nbsp;more&nbsp;it&nbsp;is&nbsp;important.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;metric&nbsp;is&nbsp;not&nbsp;suitable&nbsp;for&nbsp;ranking&nbsp;terms&nbsp;directly,&nbsp;but&nbsp;it&nbsp;is&nbsp;proved&nbsp;as&nbsp;useful&nbsp;feature&nbsp;for&nbsp;keywords&nbsp;extraction<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'neighborhood_size'&nbsp;computes&nbsp;the&nbsp;number&nbsp;of&nbsp;immediate&nbsp;neighbors&nbsp;to&nbsp;a&nbsp;node.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;is&nbsp;a&nbsp;version&nbsp;of&nbsp;node&nbsp;degree&nbsp;that&nbsp;disregards&nbsp;self-loops<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;Note:&nbsp;Centrality&nbsp;measures&nbsp;(such&nbsp;as&nbsp;"current&nbsp;flow&nbsp;betweeness",&nbsp;"current&nbsp;flow&nbsp;closeness",&nbsp;"communicability_betweenness")<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;does&nbsp;not&nbsp;support&nbsp;loosely&nbsp;connected&nbsp;graph&nbsp;and&nbsp;betweeness&nbsp;centrality&nbsp;measures&nbsp;cannot&nbsp;compute&nbsp;on&nbsp;single&nbsp;isolated&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;It&nbsp;is&nbsp;recommended&nbsp;to&nbsp;re-consider&nbsp;the&nbsp;graph&nbsp;construction&nbsp;method&nbsp;or&nbsp;increase&nbsp;context&nbsp;window&nbsp;size&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ensure&nbsp;a&nbsp;(strongly)&nbsp;connected&nbsp;graph.<br>
:type&nbsp;max_iter:&nbsp;int,&nbsp;optional<br>
:param&nbsp;max_iter:&nbsp;number&nbsp;of&nbsp;maximum&nbsp;iteration&nbsp;of&nbsp;pagerank,&nbsp;katz_centrality<br>
:type&nbsp;tol:&nbsp;float,&nbsp;optional,&nbsp;default&nbsp;1.0e-6<br>
:param&nbsp;tol:&nbsp;Error&nbsp;tolerance&nbsp;used&nbsp;to&nbsp;check&nbsp;convergence,&nbsp;the&nbsp;value&nbsp;varies&nbsp;for&nbsp;specific&nbsp;solver<br>
:type&nbsp;weight_comb:&nbsp;str<br>
:param&nbsp;weight_comb:&nbsp;&nbsp;{'avg',&nbsp;'norm_avg',&nbsp;'log_norm_avg',&nbsp;'gaussian_norm_avg',&nbsp;'sum',&nbsp;'norm_sum',&nbsp;'log_norm_sum',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'gaussian_norm_sum',&nbsp;'max',&nbsp;'norm_max',&nbsp;'log_norm_max',&nbsp;'gaussian_norm_max',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'len_log_norm_max',&nbsp;'len_log_norm_avg',&nbsp;'len_log_norm_sum'},&nbsp;default&nbsp;'norm_max'<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;weight&nbsp;combination&nbsp;method&nbsp;for&nbsp;multi-word&nbsp;candidate&nbsp;terms&nbsp;weighing.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'max'&nbsp;:&nbsp;maximum&nbsp;value&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'avg'&nbsp;:&nbsp;avarage&nbsp;vertices&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'sum'&nbsp;:&nbsp;sum&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_max'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_avg'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_sum'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_max'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_avg'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_sum'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_max'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_avg'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_sum'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_max':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'max'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_avg':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'avg'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_sum':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'sum'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;NOTE:&nbsp;\*_norm_\*"&nbsp;penalises/smooth&nbsp;the&nbsp;longer&nbsp;term&nbsp;(than&nbsp;default&nbsp;5&nbsp;token&nbsp;size)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;to&nbsp;achieve&nbsp;a&nbsp;saturation&nbsp;level&nbsp;as&nbsp;term&nbsp;size&nbsp;grows<br>
:type&nbsp;mu:&nbsp;int,&nbsp;optional<br>
:param&nbsp;mu:&nbsp;mean&nbsp;value&nbsp;to&nbsp;set&nbsp;a&nbsp;center&nbsp;point&nbsp;(default&nbsp;to&nbsp;5)&nbsp;in&nbsp;order&nbsp;to&nbsp;rank&nbsp;the&nbsp;MWT&nbsp;candidates&nbsp;higher&nbsp;that&nbsp;are&nbsp;near&nbsp;the&nbsp;central&nbsp;point<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;param&nbsp;is&nbsp;only&nbsp;required&nbsp;and&nbsp;effective&nbsp;for&nbsp;normalisation&nbsp;based&nbsp;MWT&nbsp;weighting&nbsp;methods<br>
:type&nbsp;workers:&nbsp;int,&nbsp;optional<br>
:param&nbsp;workers:&nbsp;number&nbsp;of&nbsp;workers&nbsp;(CPU&nbsp;cores)<br>
&nbsp;<br>
:rtype:&nbsp;tuple&nbsp;[list[tuple[string,float]],&nbsp;dict[string:float]]<br>
:return:&nbsp;keywords:&nbsp;sorted&nbsp;keywords&nbsp;with&nbsp;weights&nbsp;along&nbsp;with&nbsp;Top&nbsp;T&nbsp;weighted&nbsp;vertices<br>
:raise:&nbsp;ValueError</tt></dd></dl>
 <dl><dt><a name="-keywords_extraction_from_corpus_directory"><strong>keywords_extraction_from_corpus_directory</strong></a>(corpus_dir:str, encoding:str='utf-8', solver:str='pagerank', max_iter:int=100, tol:float=0.0001, window:int=2, top_p:float=0.3, top_t:Union[int, NoneType]=None, directed:bool=False, weighted:bool=False, syntactic_categories:Set[str]={'NNP', 'JJ', 'NNS', 'NN'}, stop_words:Set[str]=None, lemma:bool=False, weight_comb:str='norm_max', mu:int=5, export:bool=False, export_format:str='csv', export_path:str='', workers:int=1) -&gt; Tuple[List[Tuple[str, float]], Dict[str, float]]</dt><dd><tt>:type&nbsp;corpus_dir:&nbsp;string<br>
:param&nbsp;corpus_dir:&nbsp;corpus&nbsp;directory&nbsp;where&nbsp;text&nbsp;files&nbsp;are&nbsp;located&nbsp;and&nbsp;will&nbsp;be&nbsp;read&nbsp;and&nbsp;processed<br>
:type&nbsp;encoding:&nbsp;string,&nbsp;required<br>
:param&nbsp;encoding:&nbsp;encoding&nbsp;of&nbsp;the&nbsp;text,&nbsp;default&nbsp;as&nbsp;'utf-8',<br>
:type&nbsp;solver:&nbsp;string,&nbsp;optional<br>
:param&nbsp;solver:&nbsp;{'pagerank',&nbsp;'pagerank_numpy',&nbsp;'pagerank_scipy',&nbsp;'betweenness_centrality',&nbsp;'degree_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'hits',&nbsp;'closeness_centrality',&nbsp;'edge_betweenness_centrality',&nbsp;'eigenvector_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'katz_centrality',&nbsp;'communicability_betweenness',&nbsp;'current_flow_closeness',&nbsp;'current_flow_betweenness',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'edge_current_flow_betweenness',&nbsp;'load_centrality',&nbsp;'clustering_coefficient',&nbsp;'TeRGraph',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'coreness'},&nbsp;default&nbsp;'pagerank'<br>
&nbsp;&nbsp;&nbsp;&nbsp;PageRank&nbsp;Algorithms&nbsp;supported&nbsp;in&nbsp;networkx&nbsp;to&nbsp;use&nbsp;in&nbsp;the&nbsp;vertices&nbsp;ranking.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'betweenness_centrality'&nbsp;computes&nbsp;the&nbsp;shortest-path&nbsp;betweenness&nbsp;centrality&nbsp;of&nbsp;a&nbsp;node<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'degree_centrality'&nbsp;computes&nbsp;the&nbsp;degree&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'hits'&nbsp;computes&nbsp;HITS&nbsp;algorithm&nbsp;for&nbsp;a&nbsp;node.&nbsp;The&nbsp;avg.&nbsp;of&nbsp;Authority&nbsp;value&nbsp;and&nbsp;Hub&nbsp;value&nbsp;is&nbsp;computed<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'closeness_centrality'&nbsp;computes&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_betweenness_centrality'&nbsp;computes&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Maximum&nbsp;edge&nbsp;betweenness&nbsp;value&nbsp;in&nbsp;all&nbsp;the&nbsp;possible&nbsp;edge&nbsp;pairs&nbsp;is&nbsp;adopted&nbsp;for&nbsp;each&nbsp;vertex<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'eigenvector_centrality'&nbsp;computes&nbsp;the&nbsp;eigenvector&nbsp;centrality&nbsp;for&nbsp;the&nbsp;cooocurrence&nbsp;graph.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'katz_centrality'&nbsp;computes&nbsp;the&nbsp;Katz&nbsp;centrality&nbsp;for&nbsp;the&nbsp;nodes&nbsp;based&nbsp;on&nbsp;the&nbsp;centrality&nbsp;of&nbsp;its&nbsp;neighbors.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'communicability_betweenness'&nbsp;computes&nbsp;subgraph&nbsp;communicability&nbsp;for&nbsp;all&nbsp;pairs&nbsp;of&nbsp;nodes<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_closeness'&nbsp;computes&nbsp;current-flow&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'load_centrality'&nbsp;computes&nbsp;edge&nbsp;load.&nbsp;This&nbsp;is&nbsp;a&nbsp;experimental&nbsp;algorithm&nbsp;in&nbsp;nextworkx<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;that&nbsp;counts&nbsp;the&nbsp;number&nbsp;of&nbsp;shortest&nbsp;paths&nbsp;which&nbsp;cross&nbsp;each&nbsp;edge.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'clustering_coefficient'&nbsp;computes&nbsp;the&nbsp;clustering&nbsp;coefficient&nbsp;for&nbsp;nodes.&nbsp;Only&nbsp;undirected&nbsp;graph&nbsp;is&nbsp;supported.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'TeRGraph':&nbsp;computes&nbsp;the&nbsp;TeRGraph&nbsp;(Lossio-Ventura,&nbsp;2014)&nbsp;weights&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;solver&nbsp;requires&nbsp;a&nbsp;connected&nbsp;graph&nbsp;and&nbsp;isolated&nbsp;nodes&nbsp;will&nbsp;be&nbsp;set&nbsp;to&nbsp;0.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'coreness'&nbsp;(Batagelj&nbsp;&amp;&nbsp;Zaversnik,&nbsp;2003)&nbsp;measures&nbsp;how&nbsp;"deep"&nbsp;a&nbsp;node(word/phrase)&nbsp;is&nbsp;in&nbsp;the&nbsp;co-occurrence&nbsp;network.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;indicates&nbsp;how&nbsp;strongly&nbsp;the&nbsp;node&nbsp;is&nbsp;connected&nbsp;to&nbsp;the&nbsp;network.&nbsp;The&nbsp;"deeper"&nbsp;a&nbsp;word,&nbsp;the&nbsp;more&nbsp;it&nbsp;is&nbsp;important.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;metric&nbsp;is&nbsp;not&nbsp;suitable&nbsp;for&nbsp;ranking&nbsp;terms&nbsp;directly,&nbsp;but&nbsp;it&nbsp;is&nbsp;proved&nbsp;as&nbsp;useful&nbsp;feature&nbsp;for&nbsp;keywords&nbsp;extraction<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'neighborhood_size'&nbsp;computes&nbsp;the&nbsp;number&nbsp;of&nbsp;immediate&nbsp;neighbors&nbsp;to&nbsp;a&nbsp;node.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;is&nbsp;a&nbsp;version&nbsp;of&nbsp;node&nbsp;degree&nbsp;that&nbsp;disregards&nbsp;self-loops<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;Note:&nbsp;Centrality&nbsp;measures&nbsp;(such&nbsp;as&nbsp;"current&nbsp;flow&nbsp;betweeness",&nbsp;"current&nbsp;flow&nbsp;closeness",&nbsp;"communicability_betweenness")<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;does&nbsp;not&nbsp;support&nbsp;loosely&nbsp;connected&nbsp;graph&nbsp;and&nbsp;betweeness&nbsp;centrality&nbsp;measures&nbsp;cannot&nbsp;compute&nbsp;on&nbsp;single&nbsp;isolated&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;It&nbsp;is&nbsp;recommended&nbsp;to&nbsp;re-consider&nbsp;the&nbsp;graph&nbsp;construction&nbsp;method&nbsp;or&nbsp;increase&nbsp;context&nbsp;window&nbsp;size&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ensure&nbsp;a&nbsp;(strongly)&nbsp;connected&nbsp;graph.<br>
:type&nbsp;max_iter:&nbsp;int,&nbsp;optional<br>
:param&nbsp;max_iter:&nbsp;number&nbsp;of&nbsp;maximum&nbsp;iteration&nbsp;of&nbsp;pagerank,&nbsp;katz_centrality<br>
:type&nbsp;tol:&nbsp;float,&nbsp;optional,&nbsp;default&nbsp;1e-4<br>
:param&nbsp;tol:&nbsp;Error&nbsp;tolerance&nbsp;used&nbsp;to&nbsp;check&nbsp;convergence,&nbsp;the&nbsp;value&nbsp;varies&nbsp;for&nbsp;specific&nbsp;solver<br>
:type&nbsp;window:&nbsp;int,&nbsp;required<br>
:param&nbsp;window:&nbsp;co-occurrence&nbsp;window&nbsp;size&nbsp;(default&nbsp;with&nbsp;forward&nbsp;and&nbsp;backward&nbsp;context).&nbsp;Default&nbsp;value:&nbsp;2<br>
:type&nbsp;top_p:&nbsp;float,&nbsp;required<br>
:param&nbsp;top_p:&nbsp;the&nbsp;top&nbsp;Percentage&nbsp;of&nbsp;vertices&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing,&nbsp;Default&nbsp;as&nbsp;1/3&nbsp;of&nbsp;all&nbsp;vertices<br>
:type&nbsp;top_t:&nbsp;int|None(default),&nbsp;optional<br>
:param&nbsp;top_t:&nbsp;the&nbsp;top&nbsp;T&nbsp;vertices&nbsp;in&nbsp;the&nbsp;ranking&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if&nbsp;None&nbsp;is&nbsp;provided,&nbsp;top&nbsp;T&nbsp;will&nbsp;be&nbsp;computed&nbsp;from&nbsp;top&nbsp;P.&nbsp;Otherwise,&nbsp;top&nbsp;T&nbsp;will&nbsp;be&nbsp;used&nbsp;to&nbsp;filter&nbsp;vertices<br>
&nbsp;<br>
:type&nbsp;directed:&nbsp;bool,&nbsp;required<br>
:param&nbsp;directed:&nbsp;directed&nbsp;or&nbsp;undirected&nbsp;graph,&nbsp;best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;undirected&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper.&nbsp;Default&nbsp;as&nbsp;False<br>
:type&nbsp;weighted:&nbsp;bool,&nbsp;required<br>
:param&nbsp;weighted:&nbsp;weighted&nbsp;or&nbsp;unweighted,&nbsp;weighted&nbsp;graph&nbsp;is&nbsp;not&nbsp;supported&nbsp;yet,&nbsp;Default&nbsp;as&nbsp;False<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;unweighted&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper<br>
:type&nbsp;syntactic_categories:&nbsp;set[string],&nbsp;required<br>
:param&nbsp;syntactic_categories:&nbsp;Syntactic&nbsp;categories&nbsp;(default&nbsp;as&nbsp;Part-Of-Speech(PoS)&nbsp;tags)&nbsp;is&nbsp;defined&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;filter&nbsp;accepted&nbsp;graph&nbsp;vertices&nbsp;(essentially&nbsp;word-based&nbsp;tokens).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Default&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Any&nbsp;word&nbsp;that&nbsp;is&nbsp;not&nbsp;matched&nbsp;with&nbsp;the&nbsp;predefined&nbsp;categories&nbsp;will&nbsp;be&nbsp;removed<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;based&nbsp;on&nbsp;corresponding&nbsp;the&nbsp;PoS&nbsp;tag.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories&nbsp;only&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;stop_words:&nbsp;set[string&nbsp;{‘english’}]&nbsp;|&nbsp;None&nbsp;(default),&nbsp;Optional<br>
:param&nbsp;stop_words:&nbsp;&nbsp;remove&nbsp;stopwords&nbsp;from&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;(token&nbsp;tuple&nbsp;list)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;stop&nbsp;words&nbsp;are&nbsp;considered&nbsp;as&nbsp;noisy&nbsp;common/function&nbsp;words.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;provide&nbsp;a&nbsp;list&nbsp;of&nbsp;stop&nbsp;words&nbsp;can&nbsp;improve&nbsp;vertices&nbsp;network&nbsp;connectivity<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;increase&nbsp;weights&nbsp;to&nbsp;more&nbsp;meaningful&nbsp;words.<br>
:type&nbsp;lemma:&nbsp;bool<br>
:param&nbsp;lemma:&nbsp;if&nbsp;lemmatize&nbsp;text<br>
:type&nbsp;weight_comb:&nbsp;str<br>
:param&nbsp;weight_comb:&nbsp;&nbsp;{'avg',&nbsp;'norm_avg',&nbsp;'log_norm_avg',&nbsp;'gaussian_norm_avg',&nbsp;'sum',&nbsp;'norm_sum',&nbsp;'log_norm_sum',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'gaussian_norm_sum',&nbsp;'max',&nbsp;'norm_max',&nbsp;'log_norm_max',&nbsp;'gaussian_norm_max',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'len_log_norm_max',&nbsp;'len_log_norm_avg',&nbsp;'len_log_norm_sum'},&nbsp;default&nbsp;'norm_max'<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;weight&nbsp;combination&nbsp;method&nbsp;for&nbsp;multi-word&nbsp;candidate&nbsp;terms&nbsp;weighing.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'max'&nbsp;:&nbsp;maximum&nbsp;value&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'avg'&nbsp;:&nbsp;avarage&nbsp;vertices&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'sum'&nbsp;:&nbsp;sum&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_max'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_avg'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_sum'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_max'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_avg'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_sum'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_max'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_avg'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_sum'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_max':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'max'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_avg':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'avg'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_sum':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'sum'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;NOTE:&nbsp;\*_norm_\*"&nbsp;penalises/smooth&nbsp;the&nbsp;longer&nbsp;term&nbsp;(than&nbsp;default&nbsp;5&nbsp;token&nbsp;size)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;to&nbsp;achieve&nbsp;a&nbsp;saturation&nbsp;level&nbsp;as&nbsp;term&nbsp;size&nbsp;grows<br>
:type&nbsp;mu:&nbsp;int,&nbsp;optional<br>
:param&nbsp;mu:&nbsp;mean&nbsp;value&nbsp;to&nbsp;set&nbsp;a&nbsp;center&nbsp;point&nbsp;(default&nbsp;to&nbsp;5)&nbsp;in&nbsp;order&nbsp;to&nbsp;rank&nbsp;the&nbsp;candidates&nbsp;higher&nbsp;that&nbsp;are&nbsp;near&nbsp;the&nbsp;central&nbsp;point<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;param&nbsp;is&nbsp;only&nbsp;required&nbsp;and&nbsp;effective&nbsp;for&nbsp;normalisation&nbsp;based&nbsp;MWT&nbsp;weighting&nbsp;method<br>
:type&nbsp;export:&nbsp;bool<br>
:param&nbsp;export:&nbsp;True&nbsp;if&nbsp;export&nbsp;result&nbsp;else&nbsp;False<br>
:type&nbsp;export_format:&nbsp;string<br>
:param&nbsp;export_format:&nbsp;export&nbsp;file&nbsp;format.Support&nbsp;options:&nbsp;"csv"|"json".&nbsp;Default&nbsp;with&nbsp;"csv"<br>
:type&nbsp;export_path:&nbsp;string<br>
:param&nbsp;export_path:&nbsp;file&nbsp;path&nbsp;where&nbsp;the&nbsp;result&nbsp;will&nbsp;be&nbsp;exported&nbsp;to<br>
:type&nbsp;workers:&nbsp;int<br>
:param&nbsp;workers:&nbsp;available&nbsp;CPU&nbsp;cores&nbsp;that&nbsp;can&nbsp;be&nbsp;used&nbsp;to&nbsp;parallelize&nbsp;co-occurrence&nbsp;computation<br>
:rtype:&nbsp;tuple&nbsp;[list[tuple[string,float]],&nbsp;dict[string:float]]<br>
:return:&nbsp;keywords:&nbsp;sorted&nbsp;keywords&nbsp;with&nbsp;weights&nbsp;along&nbsp;with&nbsp;Top&nbsp;T&nbsp;weighted&nbsp;vertices</tt></dd></dl>
 <dl><dt><a name="-keywords_extraction_from_segmented_corpus"><strong>keywords_extraction_from_segmented_corpus</strong></a>(segmented_corpus_context:Union[Generator[List[str], NoneType, NoneType], jgtextrank.utility.CorpusContent2RawSentences], solver:str='pagerank', max_iter:int=100, tol:float=1e-06, window:int=2, top_p:float=0.3, top_t:Union[int, NoneType]=None, directed:bool=False, weighted:bool=False, conn_with_original_ctx:bool=True, syntactic_categories:Set[str]={'NNP', 'JJ', 'NNS', 'NN'}, stop_words:Set[str]=None, lemma:bool=False, weight_comb:str='norm_max', mu:int=5, export:bool=False, export_format:str='csv', export_path:str='', encoding:str='utf-8', workers:int=1) -&gt; Tuple[List[Tuple[str, float]], Dict[str, float]]</dt><dd><tt>TextRank&nbsp;keywords&nbsp;extraction&nbsp;for&nbsp;a&nbsp;list&nbsp;of&nbsp;context&nbsp;of&nbsp;tokenised&nbsp;textual&nbsp;corpus.<br>
This&nbsp;method&nbsp;allows&nbsp;any&nbsp;pre-defined&nbsp;keyword&nbsp;co-occurrence&nbsp;context&nbsp;criteria&nbsp;(e.g.,&nbsp;sentence,&nbsp;or&nbsp;paragraph,<br>
or&nbsp;section,&nbsp;or&nbsp;a&nbsp;user-defined&nbsp;segment)&nbsp;and&nbsp;any&nbsp;pre-defined&nbsp;word&nbsp;segmentation<br>
&nbsp;<br>
:type&nbsp;segmented_corpus_context:&nbsp;list|generator,&nbsp;required<br>
:param&nbsp;segmented_corpus_context:&nbsp;pre-tokenised&nbsp;corpus&nbsp;formatted&nbsp;in&nbsp;pre-defined&nbsp;context&nbsp;list.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Tokenised&nbsp;sentence&nbsp;list&nbsp;is&nbsp;the&nbsp;recommended(and&nbsp;default)&nbsp;context&nbsp;corpus&nbsp;in&nbsp;TextRank.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;You&nbsp;can&nbsp;also&nbsp;choose&nbsp;your&nbsp;own&nbsp;pre-defined&nbsp;co-occurrence&nbsp;context&nbsp;(e.g.,&nbsp;paragraph,&nbsp;entire&nbsp;document,&nbsp;a&nbsp;user-defined&nbsp;segment).<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;:Example:&nbsp;input:<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;context_1&nbsp;=&nbsp;["The",&nbsp;"quick",&nbsp;"brown",&nbsp;"fox",&nbsp;"jumped",&nbsp;"over",&nbsp;"the",&nbsp;"lazy",&nbsp;"dog",&nbsp;".",&nbsp;"hey","diddle",&nbsp;"diddle",&nbsp;",",&nbsp;"the",&nbsp;"cat",&nbsp;"and",&nbsp;"the",&nbsp;"fiddle","."]<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;context_2&nbsp;=&nbsp;["The",&nbsp;"cow",&nbsp;"jumped",&nbsp;"over",&nbsp;"the",&nbsp;"moon",".",&nbsp;"The",&nbsp;"little",&nbsp;"dog",&nbsp;"laughted",&nbsp;"to",&nbsp;"see","such",&nbsp;"fun",&nbsp;"."]<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;segmented_corpus_context&nbsp;=&nbsp;[context_1,&nbsp;context_2]<br>
:type&nbsp;solver:&nbsp;string,&nbsp;optional<br>
:param&nbsp;solver:&nbsp;{'pagerank',&nbsp;'pagerank_numpy',&nbsp;'pagerank_scipy',&nbsp;'betweenness_centrality',&nbsp;'degree_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'hits',&nbsp;'closeness_centrality',&nbsp;'edge_betweenness_centrality',&nbsp;'eigenvector_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'katz_centrality',&nbsp;'communicability_betweenness',&nbsp;'current_flow_closeness',&nbsp;'current_flow_betweenness',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'edge_current_flow_betweenness',&nbsp;'load_centrality',&nbsp;'clustering_coefficient',&nbsp;'TeRGraph',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'coreness'},&nbsp;default&nbsp;'pagerank'<br>
&nbsp;&nbsp;&nbsp;&nbsp;PageRank&nbsp;Algorithms&nbsp;supported&nbsp;in&nbsp;networkx&nbsp;to&nbsp;use&nbsp;in&nbsp;the&nbsp;vertices&nbsp;ranking.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'betweenness_centrality'&nbsp;computes&nbsp;the&nbsp;shortest-path&nbsp;betweenness&nbsp;centrality&nbsp;of&nbsp;a&nbsp;node<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'degree_centrality'&nbsp;computes&nbsp;the&nbsp;degree&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'hits'&nbsp;computes&nbsp;HITS&nbsp;algorithm&nbsp;for&nbsp;a&nbsp;node.&nbsp;The&nbsp;avg.&nbsp;of&nbsp;Authority&nbsp;value&nbsp;and&nbsp;Hub&nbsp;value&nbsp;is&nbsp;computed<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'closeness_centrality'&nbsp;computes&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_betweenness_centrality'&nbsp;computes&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Maximum&nbsp;edge&nbsp;betweenness&nbsp;value&nbsp;in&nbsp;all&nbsp;the&nbsp;possible&nbsp;edge&nbsp;pairs&nbsp;is&nbsp;adopted&nbsp;for&nbsp;each&nbsp;vertex<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'eigenvector_centrality'&nbsp;computes&nbsp;the&nbsp;eigenvector&nbsp;centrality&nbsp;for&nbsp;the&nbsp;cooocurrence&nbsp;graph.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'katz_centrality'&nbsp;computes&nbsp;the&nbsp;Katz&nbsp;centrality&nbsp;for&nbsp;the&nbsp;nodes&nbsp;based&nbsp;on&nbsp;the&nbsp;centrality&nbsp;of&nbsp;its&nbsp;neighbors.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'communicability_betweenness'&nbsp;computes&nbsp;subgraph&nbsp;communicability&nbsp;for&nbsp;all&nbsp;pairs&nbsp;of&nbsp;nodes<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_closeness'&nbsp;computes&nbsp;current-flow&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'load_centrality'&nbsp;computes&nbsp;edge&nbsp;load.&nbsp;This&nbsp;is&nbsp;a&nbsp;experimental&nbsp;algorithm&nbsp;in&nbsp;nextworkx<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;that&nbsp;counts&nbsp;the&nbsp;number&nbsp;of&nbsp;shortest&nbsp;paths&nbsp;which&nbsp;cross&nbsp;each&nbsp;edge.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'clustering_coefficient'&nbsp;computes&nbsp;the&nbsp;clustering&nbsp;coefficient&nbsp;for&nbsp;nodes.&nbsp;Only&nbsp;undirected&nbsp;graph&nbsp;is&nbsp;supported.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'TeRGraph':&nbsp;computes&nbsp;the&nbsp;TeRGraph&nbsp;(Lossio-Ventura,&nbsp;2014)&nbsp;weights&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;solver&nbsp;requires&nbsp;a&nbsp;connected&nbsp;graph&nbsp;and&nbsp;isolated&nbsp;nodes&nbsp;will&nbsp;be&nbsp;set&nbsp;to&nbsp;0.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'coreness'&nbsp;(Batagelj&nbsp;&amp;&nbsp;Zaversnik,&nbsp;2003)&nbsp;measures&nbsp;how&nbsp;"deep"&nbsp;a&nbsp;node(word/phrase)&nbsp;is&nbsp;in&nbsp;the&nbsp;co-occurrence&nbsp;network.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;indicates&nbsp;how&nbsp;strongly&nbsp;the&nbsp;node&nbsp;is&nbsp;connected&nbsp;to&nbsp;the&nbsp;network.&nbsp;The&nbsp;"deeper"&nbsp;a&nbsp;word,&nbsp;the&nbsp;more&nbsp;it&nbsp;is&nbsp;important.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;metric&nbsp;is&nbsp;not&nbsp;suitable&nbsp;for&nbsp;ranking&nbsp;terms&nbsp;directly,&nbsp;but&nbsp;it&nbsp;is&nbsp;proved&nbsp;as&nbsp;useful&nbsp;feature&nbsp;for&nbsp;keywords&nbsp;extraction<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'neighborhood_size'&nbsp;computes&nbsp;the&nbsp;number&nbsp;of&nbsp;immediate&nbsp;neighbors&nbsp;to&nbsp;a&nbsp;node.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;is&nbsp;a&nbsp;version&nbsp;of&nbsp;node&nbsp;degree&nbsp;that&nbsp;disregards&nbsp;self-loops<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;Note:&nbsp;Centrality&nbsp;measures&nbsp;(such&nbsp;as&nbsp;"current&nbsp;flow&nbsp;betweeness",&nbsp;"current&nbsp;flow&nbsp;closeness",&nbsp;"communicability_betweenness")<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;does&nbsp;not&nbsp;support&nbsp;loosely&nbsp;connected&nbsp;graph&nbsp;and&nbsp;betweeness&nbsp;centrality&nbsp;measures&nbsp;cannot&nbsp;compute&nbsp;on&nbsp;single&nbsp;isolated&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;It&nbsp;is&nbsp;recommended&nbsp;to&nbsp;re-consider&nbsp;the&nbsp;graph&nbsp;construction&nbsp;method&nbsp;or&nbsp;increase&nbsp;context&nbsp;window&nbsp;size&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ensure&nbsp;a&nbsp;(strongly)&nbsp;connected&nbsp;graph.<br>
:type&nbsp;max_iter:&nbsp;int,&nbsp;optional<br>
:param&nbsp;max_iter:&nbsp;number&nbsp;of&nbsp;maximum&nbsp;iteration&nbsp;of&nbsp;pagerank,&nbsp;katz_centrality<br>
:type&nbsp;tol:&nbsp;float,&nbsp;optional,&nbsp;default&nbsp;1.0e-6<br>
:param&nbsp;tol:&nbsp;Error&nbsp;tolerance&nbsp;used&nbsp;to&nbsp;check&nbsp;convergence,&nbsp;the&nbsp;value&nbsp;varies&nbsp;for&nbsp;specific&nbsp;solver<br>
:type&nbsp;window:&nbsp;int,&nbsp;required<br>
:param&nbsp;window:&nbsp;co-occurrence&nbsp;window&nbsp;size&nbsp;(default&nbsp;with&nbsp;forward&nbsp;and&nbsp;backward&nbsp;context).&nbsp;Default&nbsp;value:&nbsp;2<br>
:type&nbsp;top_p:&nbsp;float,&nbsp;optional<br>
:param&nbsp;top_p:&nbsp;the&nbsp;top&nbsp;Percentage&nbsp;of&nbsp;vertices&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing,&nbsp;Default&nbsp;as&nbsp;1/3&nbsp;of&nbsp;all&nbsp;vertices<br>
:type&nbsp;top_t:&nbsp;int|None(default),&nbsp;optional<br>
:param&nbsp;top_t:&nbsp;the&nbsp;top&nbsp;T&nbsp;vertices&nbsp;in&nbsp;the&nbsp;ranking&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing<br>
:type&nbsp;directed:&nbsp;bool,&nbsp;required<br>
:param&nbsp;directed:&nbsp;directed&nbsp;or&nbsp;undirected&nbsp;graph,&nbsp;best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;undirected&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper.&nbsp;Default&nbsp;as&nbsp;False<br>
:type&nbsp;weighted:&nbsp;bool,&nbsp;required<br>
:param&nbsp;weighted:&nbsp;weighted&nbsp;or&nbsp;unweighted,&nbsp;Custom&nbsp;weighted&nbsp;graph&nbsp;is&nbsp;not&nbsp;supported&nbsp;yet,&nbsp;Default&nbsp;as&nbsp;False<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;unweighted&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;When&nbsp;this&nbsp;is&nbsp;set&nbsp;to&nbsp;True,&nbsp;graph&nbsp;construction&nbsp;component&nbsp;will&nbsp;try&nbsp;to&nbsp;construct&nbsp;a&nbsp;fully-connected&nbsp;graph<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;by&nbsp;connecting&nbsp;isolated&nbsp;nodes&nbsp;(due&nbsp;to&nbsp;small&nbsp;context&nbsp;window)&nbsp;with&nbsp;low&nbsp;weight&nbsp;(default&nbsp;to&nbsp;0.001)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Please&nbsp;check&nbsp;if&nbsp;the&nbsp;ranking&nbsp;algorithm&nbsp;supports&nbsp;weighted&nbsp;graph<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Note:&nbsp;custom&nbsp;weights&nbsp;is&nbsp;not&nbsp;supported&nbsp;yet.<br>
&nbsp;<br>
:type&nbsp;conn_with_original_ctx:&nbsp;bool,&nbsp;optional<br>
:param&nbsp;conn_with_original_ctx:&nbsp;True&nbsp;if&nbsp;checking&nbsp;two&nbsp;vertices&nbsp;co-occurrence&nbsp;link&nbsp;from&nbsp;original&nbsp;context<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else&nbsp;checking&nbsp;connections&nbsp;from&nbsp;filtered&nbsp;context<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;More&nbsp;vertices&nbsp;connection&nbsp;can&nbsp;be&nbsp;built&nbsp;if&nbsp;'conn_with_original_ctx'&nbsp;is&nbsp;set&nbsp;to&nbsp;False<br>
:type&nbsp;syntactic_categories:&nbsp;set[string],&nbsp;required<br>
:param&nbsp;syntactic_categories:&nbsp;Syntactic&nbsp;categories&nbsp;(default&nbsp;as&nbsp;Part-Of-Speech(PoS)&nbsp;tags)&nbsp;is&nbsp;defined&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;filter&nbsp;accepted&nbsp;graph&nbsp;vertices&nbsp;(essentially&nbsp;word-based&nbsp;tokens).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Default&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Any&nbsp;word&nbsp;that&nbsp;is&nbsp;not&nbsp;matched&nbsp;with&nbsp;the&nbsp;predefined&nbsp;categories&nbsp;will&nbsp;be&nbsp;removed<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;based&nbsp;on&nbsp;corresponding&nbsp;the&nbsp;PoS&nbsp;tag.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories&nbsp;only&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;stop_words:&nbsp;set[string&nbsp;{‘english’}]&nbsp;|&nbsp;None&nbsp;(default),&nbsp;Optional<br>
:param&nbsp;stop_words:&nbsp;&nbsp;remove&nbsp;stopwords&nbsp;from&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;(token&nbsp;tuple&nbsp;list)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;stop&nbsp;words&nbsp;are&nbsp;considered&nbsp;as&nbsp;noisy&nbsp;common/function&nbsp;words.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;provide&nbsp;a&nbsp;list&nbsp;of&nbsp;stop&nbsp;words&nbsp;can&nbsp;improve&nbsp;vertices&nbsp;network&nbsp;connectivity<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;increase&nbsp;weights&nbsp;to&nbsp;more&nbsp;meaningful&nbsp;words.<br>
:type&nbsp;lemma:&nbsp;bool<br>
:param&nbsp;lemma:&nbsp;if&nbsp;lemmatize&nbsp;text<br>
:type&nbsp;weight_comb:&nbsp;str<br>
:param&nbsp;weight_comb:&nbsp;&nbsp;{'avg',&nbsp;'norm_avg',&nbsp;'log_norm_avg',&nbsp;'gaussian_norm_avg',&nbsp;'sum',&nbsp;'norm_sum',&nbsp;'log_norm_sum',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'gaussian_norm_sum',&nbsp;'max',&nbsp;'norm_max',&nbsp;'log_norm_max',&nbsp;'gaussian_norm_max',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'len_log_norm_max',&nbsp;'len_log_norm_avg',&nbsp;'len_log_norm_sum'},&nbsp;default&nbsp;'norm_max'<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;weight&nbsp;combination&nbsp;method&nbsp;for&nbsp;multi-word&nbsp;candidate&nbsp;terms&nbsp;weighing.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'max'&nbsp;:&nbsp;maximum&nbsp;value&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'avg'&nbsp;:&nbsp;avarage&nbsp;vertices&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'sum'&nbsp;:&nbsp;sum&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_max'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_avg'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_sum'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_max'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_avg'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_sum'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_max'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_avg'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_sum'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_max':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'max'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_avg':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'avg'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_sum':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'sum'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;NOTE:&nbsp;\*_norm_\*"&nbsp;penalises/smooth&nbsp;the&nbsp;longer&nbsp;term&nbsp;(than&nbsp;default&nbsp;5&nbsp;token&nbsp;size)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;to&nbsp;achieve&nbsp;a&nbsp;saturation&nbsp;level&nbsp;as&nbsp;term&nbsp;size&nbsp;grows<br>
:type&nbsp;mu:&nbsp;int,&nbsp;optional<br>
:param&nbsp;mu:&nbsp;mean&nbsp;value&nbsp;to&nbsp;set&nbsp;a&nbsp;center&nbsp;point&nbsp;(default&nbsp;to&nbsp;5)&nbsp;in&nbsp;order&nbsp;to&nbsp;rank&nbsp;the&nbsp;candidates&nbsp;higher&nbsp;that&nbsp;are&nbsp;near&nbsp;the&nbsp;central&nbsp;point<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;param&nbsp;is&nbsp;only&nbsp;required&nbsp;and&nbsp;effective&nbsp;for&nbsp;normalisation&nbsp;based&nbsp;MWT&nbsp;weighting&nbsp;method<br>
:type&nbsp;export:&nbsp;bool<br>
:param&nbsp;export:&nbsp;True&nbsp;if&nbsp;export&nbsp;result&nbsp;else&nbsp;False<br>
:type&nbsp;export_format:&nbsp;string<br>
:param&nbsp;export_format:&nbsp;export&nbsp;file&nbsp;format.&nbsp;Support&nbsp;options:&nbsp;"csv"|"json".&nbsp;Default&nbsp;with&nbsp;"csv"<br>
:type&nbsp;export_path:&nbsp;string<br>
:param&nbsp;export_path:&nbsp;file&nbsp;path&nbsp;where&nbsp;the&nbsp;result&nbsp;will&nbsp;be&nbsp;exported&nbsp;to<br>
:type&nbsp;encoding:&nbsp;string,&nbsp;required<br>
:param&nbsp;encoding:&nbsp;encoding&nbsp;of&nbsp;the&nbsp;text,&nbsp;default&nbsp;as&nbsp;'utf-8',<br>
:type&nbsp;workers:&nbsp;int<br>
:param&nbsp;workers:&nbsp;available&nbsp;CPU&nbsp;cores,&nbsp;default&nbsp;to&nbsp;use&nbsp;all&nbsp;the&nbsp;available&nbsp;CPU&nbsp;cores<br>
:rtype:&nbsp;tuple&nbsp;[list[tuple[string,float]],&nbsp;dict[string,&nbsp;float]]<br>
:return:&nbsp;keywords:&nbsp;sorted&nbsp;keywords&nbsp;with&nbsp;weights&nbsp;along&nbsp;with&nbsp;Top&nbsp;T&nbsp;weighted&nbsp;vertices</tt></dd></dl>
 <dl><dt><a name="-keywords_extraction_from_tagged_corpus"><strong>keywords_extraction_from_tagged_corpus</strong></a>(tagged_corpus_context:List[List[Tuple[str, str]]], solver:str='pagerank', max_iter:int=100, tol:float=1e-06, window:int=2, top_p:float=0.3, top_t:Union[int, NoneType]=None, directed:bool=False, weighted:bool=False, conn_with_original_ctx:bool=True, syntactic_categories:Set[str]={'NNP', 'JJ', 'NNS', 'NN'}, stop_words:Set[str]=None, lemma:bool=False, weight_comb:str='norm_max', mu:int=5, export:bool=False, export_format:str='csv', export_path:str='', encoding:str='utf-8', workers:int=1) -&gt; Tuple[List[Tuple[str, float]], List[Tuple[str, float]]]</dt><dd><tt>TextRank&nbsp;keywords&nbsp;extraction&nbsp;for&nbsp;pos&nbsp;tagged&nbsp;corpus&nbsp;context&nbsp;list<br>
&nbsp;<br>
This&nbsp;method&nbsp;allows&nbsp;to&nbsp;use&nbsp;external&nbsp;Part-of-Speech&nbsp;tagging,&nbsp;and&nbsp;any&nbsp;pre-defined&nbsp;keyword&nbsp;co-occurrence&nbsp;context&nbsp;criteria&nbsp;(e.g.,&nbsp;sentence,&nbsp;or&nbsp;paragraph,<br>
or&nbsp;section,&nbsp;or&nbsp;a&nbsp;user-defined&nbsp;segment)&nbsp;and&nbsp;any&nbsp;pre-defined&nbsp;word&nbsp;segmentation<br>
&nbsp;<br>
:type&nbsp;tagged_corpus_context:&nbsp;list[list[tuple[string,&nbsp;string]]]&nbsp;or&nbsp;generator<br>
:param&nbsp;tagged_corpus_context:&nbsp;pre-tagged&nbsp;corpus&nbsp;in&nbsp;the&nbsp;form&nbsp;of&nbsp;tuple<br>
:type&nbsp;solver:&nbsp;string,&nbsp;optional<br>
:param&nbsp;solver:&nbsp;{'pagerank',&nbsp;'pagerank_numpy',&nbsp;'pagerank_scipy',&nbsp;'betweenness_centrality',&nbsp;'degree_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'hits',&nbsp;'closeness_centrality',&nbsp;'edge_betweenness_centrality',&nbsp;'eigenvector_centrality',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'katz_centrality',&nbsp;'communicability_betweenness',&nbsp;'current_flow_closeness',&nbsp;'current_flow_betweenness',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'edge_current_flow_betweenness',&nbsp;'load_centrality',&nbsp;'clustering_coefficient',&nbsp;'TeRGraph',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'coreness'},&nbsp;default&nbsp;'pagerank'<br>
&nbsp;&nbsp;&nbsp;&nbsp;PageRank&nbsp;Algorithms&nbsp;supported&nbsp;in&nbsp;networkx&nbsp;to&nbsp;use&nbsp;in&nbsp;the&nbsp;vertices&nbsp;ranking.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'betweenness_centrality'&nbsp;computes&nbsp;the&nbsp;shortest-path&nbsp;betweenness&nbsp;centrality&nbsp;of&nbsp;a&nbsp;node<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'degree_centrality'&nbsp;computes&nbsp;the&nbsp;degree&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'hits'&nbsp;computes&nbsp;HITS&nbsp;algorithm&nbsp;for&nbsp;a&nbsp;node.&nbsp;The&nbsp;avg.&nbsp;of&nbsp;Authority&nbsp;value&nbsp;and&nbsp;Hub&nbsp;value&nbsp;is&nbsp;computed<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'closeness_centrality'&nbsp;computes&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_betweenness_centrality'&nbsp;computes&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Maximum&nbsp;edge&nbsp;betweenness&nbsp;value&nbsp;in&nbsp;all&nbsp;the&nbsp;possible&nbsp;edge&nbsp;pairs&nbsp;is&nbsp;adopted&nbsp;for&nbsp;each&nbsp;vertex<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'eigenvector_centrality'&nbsp;computes&nbsp;the&nbsp;eigenvector&nbsp;centrality&nbsp;for&nbsp;the&nbsp;cooocurrence&nbsp;graph.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'katz_centrality'&nbsp;computes&nbsp;the&nbsp;Katz&nbsp;centrality&nbsp;for&nbsp;the&nbsp;nodes&nbsp;based&nbsp;on&nbsp;the&nbsp;centrality&nbsp;of&nbsp;its&nbsp;neighbors.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'communicability_betweenness'&nbsp;computes&nbsp;subgraph&nbsp;communicability&nbsp;for&nbsp;all&nbsp;pairs&nbsp;of&nbsp;nodes<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_closeness'&nbsp;computes&nbsp;current-flow&nbsp;closeness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'edge_current_flow_betweenness'&nbsp;computes&nbsp;current-flow&nbsp;betweenness&nbsp;centrality&nbsp;for&nbsp;edges.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'load_centrality'&nbsp;computes&nbsp;edge&nbsp;load.&nbsp;This&nbsp;is&nbsp;a&nbsp;experimental&nbsp;algorithm&nbsp;in&nbsp;nextworkx<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;that&nbsp;counts&nbsp;the&nbsp;number&nbsp;of&nbsp;shortest&nbsp;paths&nbsp;which&nbsp;cross&nbsp;each&nbsp;edge.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'clustering_coefficient'&nbsp;computes&nbsp;the&nbsp;clustering&nbsp;coefficient&nbsp;for&nbsp;nodes.&nbsp;Only&nbsp;undirected&nbsp;graph&nbsp;is&nbsp;supported.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'TeRGraph':&nbsp;computes&nbsp;the&nbsp;TeRGraph&nbsp;(Lossio-Ventura,&nbsp;2014)&nbsp;weights&nbsp;for&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;solver&nbsp;requires&nbsp;a&nbsp;connected&nbsp;graph&nbsp;and&nbsp;isolated&nbsp;nodes&nbsp;will&nbsp;be&nbsp;set&nbsp;to&nbsp;0.<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'coreness'&nbsp;(Batagelj&nbsp;&amp;&nbsp;Zaversnik,&nbsp;2003)&nbsp;measures&nbsp;how&nbsp;"deep"&nbsp;a&nbsp;node(word/phrase)&nbsp;is&nbsp;in&nbsp;the&nbsp;co-occurrence&nbsp;network.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;indicates&nbsp;how&nbsp;strongly&nbsp;the&nbsp;node&nbsp;is&nbsp;connected&nbsp;to&nbsp;the&nbsp;network.&nbsp;The&nbsp;"deeper"&nbsp;a&nbsp;word,&nbsp;the&nbsp;more&nbsp;it&nbsp;is&nbsp;important.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;metric&nbsp;is&nbsp;not&nbsp;suitable&nbsp;for&nbsp;ranking&nbsp;terms&nbsp;directly,&nbsp;but&nbsp;it&nbsp;is&nbsp;proved&nbsp;as&nbsp;useful&nbsp;feature&nbsp;for&nbsp;keywords&nbsp;extraction<br>
&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'neighborhood_size'&nbsp;computes&nbsp;the&nbsp;number&nbsp;of&nbsp;immediate&nbsp;neighbors&nbsp;to&nbsp;a&nbsp;node.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;is&nbsp;a&nbsp;version&nbsp;of&nbsp;node&nbsp;degree&nbsp;that&nbsp;disregards&nbsp;self-loops<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;Note:&nbsp;Centrality&nbsp;measures&nbsp;(such&nbsp;as&nbsp;"current&nbsp;flow&nbsp;betweeness",&nbsp;"current&nbsp;flow&nbsp;closeness",&nbsp;"communicability_betweenness")<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;does&nbsp;not&nbsp;support&nbsp;loosely&nbsp;connected&nbsp;graph&nbsp;and&nbsp;betweeness&nbsp;centrality&nbsp;measures&nbsp;cannot&nbsp;compute&nbsp;on&nbsp;single&nbsp;isolated&nbsp;nodes.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;It&nbsp;is&nbsp;recommended&nbsp;to&nbsp;re-consider&nbsp;the&nbsp;graph&nbsp;construction&nbsp;method&nbsp;or&nbsp;increase&nbsp;context&nbsp;window&nbsp;size&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;ensure&nbsp;a&nbsp;(strongly)&nbsp;connected&nbsp;graph.<br>
:type&nbsp;max_iter:&nbsp;int,&nbsp;optional<br>
:param&nbsp;max_iter:&nbsp;number&nbsp;of&nbsp;maximum&nbsp;iteration&nbsp;of&nbsp;pagerank,&nbsp;katz_centrality<br>
:type&nbsp;tol:&nbsp;float,&nbsp;optional,&nbsp;default&nbsp;1e4<br>
:param&nbsp;tol:&nbsp;Error&nbsp;tolerance&nbsp;used&nbsp;to&nbsp;check&nbsp;convergence,&nbsp;the&nbsp;value&nbsp;varies&nbsp;for&nbsp;specific&nbsp;solver<br>
:type&nbsp;window:&nbsp;int,&nbsp;required<br>
:param&nbsp;window:&nbsp;co-occurrence&nbsp;window&nbsp;size&nbsp;(default&nbsp;with&nbsp;forward&nbsp;and&nbsp;backward&nbsp;context).&nbsp;Default&nbsp;value:&nbsp;2<br>
:type&nbsp;top_p:&nbsp;float,&nbsp;optional<br>
:param&nbsp;top_p:&nbsp;the&nbsp;top&nbsp;Percentage&nbsp;of&nbsp;vertices&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing,&nbsp;Default&nbsp;as&nbsp;1/3&nbsp;of&nbsp;all&nbsp;vertices<br>
:type&nbsp;top_t:&nbsp;int|None(default),&nbsp;optional<br>
:param&nbsp;top_t:&nbsp;the&nbsp;top&nbsp;T&nbsp;vertices&nbsp;in&nbsp;the&nbsp;ranking&nbsp;are&nbsp;retained&nbsp;for&nbsp;post-processing<br>
:type&nbsp;directed:&nbsp;bool,&nbsp;required<br>
:param&nbsp;directed:&nbsp;directed&nbsp;or&nbsp;undirected&nbsp;graph,&nbsp;best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;undirected&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper.&nbsp;Default&nbsp;as&nbsp;False<br>
:type&nbsp;weighted:&nbsp;bool,&nbsp;required<br>
:param&nbsp;weighted:&nbsp;weighted&nbsp;or&nbsp;unweighted,&nbsp;weighted&nbsp;graph&nbsp;is&nbsp;not&nbsp;supported&nbsp;yet,&nbsp;Default&nbsp;as&nbsp;False<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;unweighted&nbsp;graph&nbsp;in&nbsp;the&nbsp;original&nbsp;paper<br>
:type&nbsp;conn_with_original_ctx:&nbsp;bool,&nbsp;optional<br>
:param&nbsp;conn_with_original_ctx:&nbsp;True&nbsp;if&nbsp;checking&nbsp;two&nbsp;vertices&nbsp;connections&nbsp;from&nbsp;original&nbsp;context<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else&nbsp;checking&nbsp;connections&nbsp;from&nbsp;filtered&nbsp;context<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;More&nbsp;vertices&nbsp;connection&nbsp;can&nbsp;be&nbsp;built&nbsp;if&nbsp;'conn_with_original_ctx'&nbsp;is&nbsp;set&nbsp;to&nbsp;False<br>
:type&nbsp;syntactic_categories:&nbsp;set[string],&nbsp;required<br>
:param&nbsp;syntactic_categories:&nbsp;Syntactic&nbsp;categories&nbsp;(default&nbsp;as&nbsp;Part-Of-Speech(PoS)&nbsp;tags)&nbsp;is&nbsp;defined&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;filter&nbsp;accepted&nbsp;graph&nbsp;vertices&nbsp;(essentially&nbsp;word-based&nbsp;tokens).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Default&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Any&nbsp;word&nbsp;that&nbsp;is&nbsp;not&nbsp;matched&nbsp;with&nbsp;the&nbsp;predefined&nbsp;categories&nbsp;will&nbsp;be&nbsp;removed<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;based&nbsp;on&nbsp;corresponding&nbsp;the&nbsp;PoS&nbsp;tag.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories&nbsp;only&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;stop_words:&nbsp;set[string&nbsp;{‘english’}]&nbsp;|&nbsp;None&nbsp;(default),&nbsp;Optional<br>
:param&nbsp;stop_words:&nbsp;&nbsp;remove&nbsp;stopwords&nbsp;from&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;(token&nbsp;tuple&nbsp;list)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;stop&nbsp;words&nbsp;are&nbsp;considered&nbsp;as&nbsp;noisy&nbsp;common/function&nbsp;words.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;provide&nbsp;a&nbsp;list&nbsp;of&nbsp;stop&nbsp;words&nbsp;can&nbsp;improve&nbsp;vertices&nbsp;network&nbsp;connectivity<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;increase&nbsp;weights&nbsp;to&nbsp;more&nbsp;meaningful&nbsp;words.<br>
:type&nbsp;lemma:&nbsp;bool<br>
:param&nbsp;lemma:&nbsp;if&nbsp;lemmatize&nbsp;text<br>
:type&nbsp;weight_comb:&nbsp;str<br>
:param&nbsp;weight_comb:&nbsp;&nbsp;{'avg',&nbsp;'norm_avg',&nbsp;'log_norm_avg',&nbsp;'gaussian_norm_avg',&nbsp;'sum',&nbsp;'norm_sum',&nbsp;'log_norm_sum',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'gaussian_norm_sum',&nbsp;'max',&nbsp;'norm_max',&nbsp;'log_norm_max',&nbsp;'gaussian_norm_max',<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;'len_log_norm_max',&nbsp;'len_log_norm_avg',&nbsp;'len_log_norm_sum'},&nbsp;default&nbsp;'norm_max'<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;weight&nbsp;combination&nbsp;method&nbsp;for&nbsp;multi-word&nbsp;candidate&nbsp;terms&nbsp;weighing.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'max'&nbsp;:&nbsp;maximum&nbsp;value&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'avg'&nbsp;:&nbsp;avarage&nbsp;vertices&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'sum'&nbsp;:&nbsp;sum&nbsp;of&nbsp;vertices&nbsp;weights<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_max'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_avg'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'norm_sum'&nbsp;:&nbsp;MWT&nbsp;unit&nbsp;size&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_max'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_avg'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'log_norm_sum'&nbsp;:&nbsp;logarithm&nbsp;based&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_max'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'max'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_avg'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'avg'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'gaussian_norm_sum'&nbsp;:&nbsp;gaussian&nbsp;normalisation&nbsp;of&nbsp;'sum'&nbsp;weight<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_max':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'max'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_avg':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'avg'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;-&nbsp;'len_log_norm_sum':&nbsp;log2(|a|&nbsp;+&nbsp;0.1)&nbsp;*&nbsp;'sum'&nbsp;adapted&nbsp;from&nbsp;CValue&nbsp;(Frantzi,&nbsp;2000)&nbsp;formulate<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;NOTE:&nbsp;\*_norm_\*"&nbsp;penalises/smooth&nbsp;the&nbsp;longer&nbsp;term&nbsp;(than&nbsp;default&nbsp;5&nbsp;token&nbsp;size)<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;to&nbsp;achieve&nbsp;a&nbsp;saturation&nbsp;level&nbsp;as&nbsp;term&nbsp;size&nbsp;grows<br>
:type&nbsp;mu:&nbsp;int,&nbsp;optional<br>
:param&nbsp;mu:&nbsp;mean&nbsp;value&nbsp;to&nbsp;set&nbsp;a&nbsp;center&nbsp;point&nbsp;(default&nbsp;to&nbsp;5)&nbsp;in&nbsp;order&nbsp;to&nbsp;rank&nbsp;the&nbsp;candidates&nbsp;higher&nbsp;that&nbsp;are&nbsp;near&nbsp;the&nbsp;central&nbsp;point<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;This&nbsp;param&nbsp;is&nbsp;only&nbsp;required&nbsp;and&nbsp;effective&nbsp;for&nbsp;normalisation&nbsp;based&nbsp;MWT&nbsp;weighting&nbsp;method<br>
:type&nbsp;export:&nbsp;bool<br>
:param&nbsp;export:&nbsp;True&nbsp;if&nbsp;export&nbsp;result&nbsp;else&nbsp;False<br>
:type&nbsp;export_format:&nbsp;string<br>
:param&nbsp;export_format:&nbsp;{'csv',&nbsp;'json'},&nbsp;default&nbsp;'csv'<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;export&nbsp;file&nbsp;format<br>
:type&nbsp;export_path:&nbsp;string<br>
:param&nbsp;export_path:&nbsp;file&nbsp;path&nbsp;where&nbsp;the&nbsp;result&nbsp;will&nbsp;be&nbsp;exported&nbsp;to<br>
:type&nbsp;encoding:&nbsp;string,&nbsp;required<br>
:param&nbsp;encoding:&nbsp;encoding&nbsp;of&nbsp;export&nbsp;file,&nbsp;default&nbsp;as&nbsp;'utf-8',<br>
:type&nbsp;workers:&nbsp;int<br>
:param&nbsp;workers:&nbsp;available&nbsp;CPU&nbsp;cores,&nbsp;default&nbsp;to&nbsp;use&nbsp;all&nbsp;the&nbsp;available&nbsp;CPU&nbsp;cores<br>
:rtype:&nbsp;tuple&nbsp;[list[tuple[string,float]],&nbsp;dict[string:float]]<br>
:return:&nbsp;keywords:&nbsp;sorted&nbsp;keywords&nbsp;with&nbsp;weights&nbsp;along&nbsp;with&nbsp;Top&nbsp;T&nbsp;weighted&nbsp;vertices</tt></dd></dl>
 <dl><dt><a name="-preprocessing"><strong>preprocessing</strong></a>(text:str, syntactic_categories:Set[str]={'NNP', 'JJ', 'NNS', 'NN'}, stop_words:Union[Set[str], NoneType]=None, lemma:bool=False) -&gt; Generator[Tuple[List[str], List[Tuple[str, str]]], NoneType, NoneType]</dt><dd><tt>pre-processing&nbsp;pipeline:&nbsp;sentence&nbsp;splitting&nbsp;-&gt;&nbsp;tokenisation&nbsp;-&gt;<br>
Part-of-Speech(PoS)&nbsp;tagging&nbsp;-&gt;&nbsp;syntactic&nbsp;filtering&nbsp;(default&nbsp;with&nbsp;sentential&nbsp;context)<br>
&nbsp;<br>
Text&nbsp;segmentation:&nbsp;using&nbsp;NLTK's&nbsp;recommended&nbsp;English&nbsp;word&nbsp;tokenizer&nbsp;(currently&nbsp;an&nbsp;improved&nbsp;:class:`.TreebankWordTokenizer`<br>
along&nbsp;with&nbsp;:class:`.PunktSentenceTokenizer`<br>
&nbsp;<br>
PoS&nbsp;tagging:&nbsp;Use&nbsp;NLTK's&nbsp;currently&nbsp;recommended&nbsp;part&nbsp;of&nbsp;speech&nbsp;tagger&nbsp;('taggers/averaged_perceptron_tagger/english.pickle')<br>
&nbsp;<br>
You&nbsp;can&nbsp;download&nbsp;both&nbsp;via<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;import&nbsp;nltk<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;nltk.download('punkt')<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&gt;&gt;&gt;&nbsp;nltk.download('averaged_perceptron_tagger')<br>
&nbsp;<br>
:type&nbsp;text:&nbsp;string<br>
:param&nbsp;text:&nbsp;plain&nbsp;text<br>
:type&nbsp;syntactic_categories:&nbsp;Set&nbsp;[of&nbsp;string],&nbsp;required<br>
:param&nbsp;syntactic_categories:&nbsp;Default&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Syntactic&nbsp;categories&nbsp;(default&nbsp;as&nbsp;Part-Of-Speech(PoS)&nbsp;tags)&nbsp;is&nbsp;defined&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;filter&nbsp;accepted&nbsp;graph&nbsp;vertices&nbsp;(default&nbsp;with&nbsp;word-based&nbsp;tokens&nbsp;as&nbsp;single&nbsp;syntactic&nbsp;unit).<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Any&nbsp;word&nbsp;that&nbsp;is&nbsp;not&nbsp;matched&nbsp;with&nbsp;the&nbsp;predefined&nbsp;categories&nbsp;will&nbsp;be&nbsp;removed&nbsp;based&nbsp;on&nbsp;corresponding&nbsp;the&nbsp;PoS&nbsp;tag.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories&nbsp;only&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;stop_words:&nbsp;Set&nbsp;of&nbsp;[string&nbsp;{‘english’}],&nbsp;or&nbsp;None&nbsp;(default),&nbsp;Optional<br>
:param&nbsp;stop_words:&nbsp;&nbsp;remove&nbsp;stopwords&nbsp;from&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;(token&nbsp;tuple&nbsp;list).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;stop&nbsp;words&nbsp;are&nbsp;considered&nbsp;as&nbsp;noisy&nbsp;common/function&nbsp;words.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;provide&nbsp;a&nbsp;list&nbsp;of&nbsp;stop&nbsp;words&nbsp;can&nbsp;improve&nbsp;vertices&nbsp;network&nbsp;connectivity<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;increase&nbsp;weights&nbsp;to&nbsp;more&nbsp;meaningful&nbsp;words.<br>
:type&nbsp;bool<br>
:param&nbsp;lemma:&nbsp;if&nbsp;lemmatize&nbsp;text<br>
:rtype:&nbsp;generatorType&nbsp;(of&nbsp;tuple)<br>
:return:&nbsp;result:&nbsp;a&nbsp;tuple&nbsp;list&nbsp;of&nbsp;tokenised&nbsp;context(default&nbsp;in&nbsp;sentence&nbsp;level)&nbsp;text<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;the&nbsp;corresponding&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;text&nbsp;filtered&nbsp;by&nbsp;syntactic&nbsp;filter</tt></dd></dl>
 <dl><dt><a name="-preprocessing_tokenised_context"><strong>preprocessing_tokenised_context</strong></a>(tokenised_context:Union[Generator[List[str], NoneType, NoneType], List[List[str]]], syntactic_categories:Set[str]={'NNP', 'JJ', 'NNS', 'NN'}, stop_words:Union[Set[str], NoneType]=None, lemma:bool=False) -&gt; Generator[Tuple[List[str], List[Tuple[str, str]]], NoneType, NoneType]</dt><dd><tt>pre-processing&nbsp;tokenised&nbsp;corpus&nbsp;context&nbsp;(recommend&nbsp;as&nbsp;sentences)<br>
&nbsp;<br>
pipeline:&nbsp;&nbsp;Part-of-Speech&nbsp;tagging&nbsp;-&gt;&nbsp;syntactic&nbsp;filtering&nbsp;(default&nbsp;with&nbsp;sentential&nbsp;context)<br>
&nbsp;<br>
:type&nbsp;tokenised_context:&nbsp;generator&nbsp;or&nbsp;iterable&nbsp;object<br>
:param&nbsp;tokenised_context:&nbsp;generator&nbsp;of&nbsp;tokenised&nbsp;context(default&nbsp;with&nbsp;sentences)<br>
:type&nbsp;syntactic_categories:&nbsp;set&nbsp;[of&nbsp;string],&nbsp;required<br>
:param&nbsp;syntactic_categories:&nbsp;Default&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Syntactic&nbsp;categories&nbsp;(default&nbsp;as&nbsp;Part-Of-Speech(PoS)&nbsp;tags)&nbsp;are&nbsp;defined&nbsp;to<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;filter&nbsp;accepted&nbsp;graph&nbsp;vertices&nbsp;(default&nbsp;with&nbsp;word-based&nbsp;tokens&nbsp;as&nbsp;single&nbsp;syntactic&nbsp;unit).<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Any&nbsp;word&nbsp;that&nbsp;is&nbsp;not&nbsp;matched&nbsp;with&nbsp;the&nbsp;predefined&nbsp;categories&nbsp;will&nbsp;be&nbsp;removed&nbsp;based&nbsp;on&nbsp;corresponding&nbsp;the&nbsp;PoS&nbsp;tag.<br>
&nbsp;<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;Best&nbsp;result&nbsp;is&nbsp;found&nbsp;with&nbsp;noun&nbsp;and&nbsp;adjective&nbsp;categories&nbsp;only&nbsp;in&nbsp;original&nbsp;paper.<br>
:type&nbsp;stop_words:&nbsp;set&nbsp;of&nbsp;[string&nbsp;{‘english’}],&nbsp;or&nbsp;None&nbsp;(default),&nbsp;Optional<br>
:param&nbsp;stop_words:&nbsp;&nbsp;remove&nbsp;stopwords&nbsp;from&nbsp;PoS&nbsp;tagged&nbsp;context&nbsp;(token&nbsp;tuple&nbsp;list).<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;The&nbsp;stop&nbsp;words&nbsp;are&nbsp;considered&nbsp;as&nbsp;noisy&nbsp;common/function&nbsp;words.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;By&nbsp;provide&nbsp;a&nbsp;list&nbsp;of&nbsp;stop&nbsp;words&nbsp;can&nbsp;improve&nbsp;vertices&nbsp;network&nbsp;connectivity<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;and&nbsp;increase&nbsp;weights&nbsp;to&nbsp;more&nbsp;meaningful&nbsp;words.<br>
:type&nbsp;bool<br>
:param&nbsp;lemma:&nbsp;if&nbsp;lemmatize&nbsp;text<br>
:rtype:&nbsp;generator[of&nbsp;tuple]<br>
:return:&nbsp;pre-processed&nbsp;raw&nbsp;text&nbsp;tokens&nbsp;splitted&nbsp;with&nbsp;context&nbsp;and&nbsp;filtered&nbsp;text&nbsp;tokens&nbsp;splitted&nbsp;with&nbsp;context</tt></dd></dl>
</td></tr></table><p>
<table width="100%" cellspacing=0 cellpadding=2 border=0 summary="section">
<tr bgcolor="#55aa55">
<td colspan=3 valign=bottom>&nbsp;<br>
<font color="#ffffff" face="helvetica, arial"><big><strong>Data</strong></big></font></td></tr>
    
<tr><td bgcolor="#55aa55"><tt>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</tt></td><td>&nbsp;</td>
<td width="100%"><strong>__all__</strong> = ['preprocessing', 'preprocessing_tokenised_context', 'build_cooccurrence_graph', 'keywords_extraction', 'keywords_extraction_from_segmented_corpus', 'keywords_extraction_from_tagged_corpus', 'keywords_extraction_from_corpus_directory', 'compute_TeRGraph', 'compute_neighborhood_size']</td></tr></table>
</body></html>