A Library that can do the following
எழுத்து.மெல்லினம்
['ங்', 'ஞ்', 'ண்', 'ந்', 'ம்', 'ன்']
எழுத்து.குறில்
['அ', 'இ', 'உ', 'எ', 'ஒ']
புணர்ச்சி.தனிமொழி_ஆக்கு('விருந்தோம்பல்')
['விருந்து', 'ஓம்பல்']
புணர்ச்சி.தொடர்மொழி_ஆக்கு('விருந்து', 'ஓம்பல்' )
விருந்தோம்பல்
மாத்திரை.மாத்திரை_கொடு('பைந்தமிழ்')
[2, 0.5, 1, 1, 0.5]
தமிழ்.பிரம்மி('வணக்கம்')
𑀯𑀡𑀓𑀓𑀫
தமிழ்.பண்டைய_வாக்கியம்_ஆக்கு(வாக்கியம் = 'வணக்கம்', வருடம் = 300 )
திருக்குறள் : பொருட்பால் : குறள் 467
எண்ணித் துணிகக் கருமம் துணிந்தபின்
எண்ணுவம் என்பது இழுக்கு
புகழேந்திப் புலவர் இயற்றிய நளவெண்பா : 1
ஆதித் தனிக்கோல மானா னடியவற்காச்
சோதித் திருத்தூணிற் றோன்றினான் வேதத்தின்
முன்னின்றான் வேழம் முதலே யெனவழைப்ப
என்னென்றா னெங்கட் கிறை
பைந்தமிழ் (pytamil) library is intended to be used in analysis of tamil literary work. A wealth of knowledge is hidden in old literature. They are time machines to past. Ever wondered what is the popular color or food in tamil speaking world in 500AD. The answer is hidden in literature. With right computer tools it becomes possible for us to dig in to this wealth of knowledge.
Core philosophy of பைந்தமிழ் (pytamil) library is to clearly separarte tamil language conepts from the programming language. For example, Tamil புணர்ச்சி rules are captured in human readable text file புணர்ச்சிவிதிகள்.yaml in YAML format. This approach has two major benefits
- This allows people with no prior knowledge in computer programming to contribute to the project and have more meaningful and natural discussion on the language concepts.
- Similar approach can be used to implement libraries for other human languages like Sanskrit, Telugu, Kannada etc.
- Developers can use the core tamil language files to port this library to other computer languages like Javascript, c# etc.
List of Core tamil language files
- pytamil/தமிழ்/resources/மாத்திரை.yaml
- pytamil/தமிழ்/resources/மாத்திரை.g4
- pytamil/தமிழ்/resources/புணர்ச்சிவிதிகள்.yaml
- pytamil/தமிழ்/resources/எழுத்து.yaml
- pytamil/தமிழ்/resources/வெண்பா.g4
- pytamil/தமிழ்/resources/கணிதம்.yaml
If you have a feature in mind, Please add a feature request here with label as enhancement
.
- return original words when a combined word is presented by predictive deomposition using புணர்ச்சி விதிகள்
- built pip module
- and many more