Skip to content

A command line tool that analyzes XML data files from curriculum courses description webpages to detect missing course informations.

Notifications You must be signed in to change notification settings

terilias/check_qa

Repository files navigation

check_qa

This command line tool, written in Java it is used for finding omitted informations from course description in the offered courses webpages by Aristotle University of Thessaloniki departments. Analyzing XML files that are generated from DeiXTo, an open source web data extraction tool, check_qa finds missed informations about the specific course (e.g. prerequisites and course contents). The results are exporting to a text file for informing secretariats of departments about the informations must be added to descriptions of the courses.

Εφαρμογή ελέγχου των σελίδων περιγραφής μαθημάτων, όπως αυτά παρουσιάζονται στον ιστότοπο της Μονάδας Διασφάλισης Ποιότητας του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης: https://qa.auth.gr/

Το παρόν project έγινε στο πλαίσιο του μαθήματος "Τεχνολογία Λογισμικού" (5ο εξάμηνο) του προπτυχιακού προγράμματος σπουδών του τμήματος Πληροφορικής Α.Π.Θ. Ο σκοπός της εφαρμογής είναι να υποδεικνύει στο προσωπικό του τμήματος ποιά μαθήματα έχουν ελλείψεις στις περιγραφές τους, ώστε να ενημερώνονται οι υπεύθυνοι των μαθημάτων και να συμπληρώνουν την περιγραφή τους. Αυτό είναι ιδιαίτερα σημαντικό καθώς οι φοιτητές για να επιλέξουν τα μαθήματα που θα παρακολουθήσουν, χρειάζονται να γνωρίζουν π.χ. το περιεχόμενο του μαθήματος, τον τρόπο βαθμολόγησης και τις προαπαιτήσεις του. Εάν αυτά τα πεδία είναι κενά στις σελίδες περιγραφής των μαθημάτων, οι φοιτητές δεν μπορούν να γνωρίζουν χρήσιμες πληροφορίες για τα μαθήματα και συνεπώς δυσκολεύονται περισσότερο για την επιλογή τους.

Το πρόγραμμα δέχεται ως είσοδο δύο αρχεία: το πρώτο είναι τύπου xml και περιέχει το περιεχόμενο των ιστοσελίδων περιγραφής των μαθημάτων του προγράμματος σπουδών του τμήματος.Το xml αρχείο είναι αρχείο εξόδου από το λογισμικό εξαγωγής περιεχομένου από ιστοσελίδες (web data extraction tool) DeiXTo.To DeiXTo είναι λογισμικό ανοικτού κώδικα. Για περισσότερες πληροφορίες και για να κατεβάσετε το DeiXTo ανατρέξτε στην ιστοσελίδα του https://deixto.com/.

Το δεύτερο αρχείο περιέχει τα πεδία για τα οποία θέλουμε να κάνουμε τον έλεγχο ύπαρξής τους στην σελίδα περιγραφής των μαθημάτων (π.χ. "Erasmus" εάν θέλουμε να εξετάσουμε εάν στην περιγραφή υπάρχουν πληροφορίες για τους φοιτητές από το πρόγραμμα ανταλλαγής φοιτητών Erasmus).

Η εκτέλεση του προγράμματος με παραμέτρους εισόδου τα δύο παραπάνω αρχεία σε περιβάλλον γραμμής εντολών, δημιουργεί το αρχείο εξόδου results.txt που σε κάθε του γραμμή δηλώνονται τα πεδία που απουσιάζουν από την σελίδα περιγραφής για κάθε μάθημα.

Για την δημιουργία αυτού του προγράμματος χρησιμοποιήθηκε η γλώσσα προγραμματισμού Java 8 και το περιβάλλον ανάπτυξης IntelliJ IDEA.Το jar αρχείο βρίσκεται στο φάκελο : check_qa/out/artifacts/check_qa_jar. Στον φάκελο "Αρχεία για εκτέλεση" υπάρχουν τα .xml αρχεία για όλα τα εξάμηνα του προπτυχιακού προγράμματος σπουδών του τμήματος Πληροφορικής καθώς και ένα αρχείο κειμένου για τα πεδία για τα οποία θα γίνει ο έλεγχος(ενδεικτικά περιέχει τα κυριότερα πεδία που θέλουμε να υπάρχουν στην περιγραφή κάθε μαθήματος). Τέλος στον ίδιο φάκελο υπάρχει το .wpf αρχείο του κανόνα εξαγωγής-προτύπου για την εκτέλεσή του στο DeiXTo (δείτε το αρχείο "παρουσίαση.pdf" για οδηγίες εκτέλεσης του DeiXTo).

About

A command line tool that analyzes XML data files from curriculum courses description webpages to detect missing course informations.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages