Subcubic algorithm for (Unweighted) Unrooted Tree Edit Distance.

master
dc.abstract.enThe tree edit distance problem is a natural generalization of the classic string edit distance problem. Given two ordered, edge-labeled trees T and Q, the edit distance between T and Q is defined as the minimum total cost of operations that transform T into Q. In one operation, we can contract an edge, split a vertex into two or change the label of an edge.For the weighted version of the problem, where the cost of each operation depends on the type of the operation and the label on the edge involved, O(n^3) time algorithms are known for both rooted and unrooted trees. The existence of a truly subcubic O(n^{3-ϵ}) time algorithm is unlikely, as it would imply a truly subcubic algorithm for the APSP problem. However, recently Mao showed that if we assume that each operation has a unit cost, then the tree edit distance between two rooted trees can be computed in O(n^{2.9546}) time. In this paper, we show how to adapt Mao's algorithm to make it work for unrooted trees and we show an O(n^{(7ω + 15)/(2ω + 6)}) ≤ O(n^{2.9417}) time algorithm for the unweighted tree edit distance between two unrooted trees, where ω ≤ 2.373 is the matrix multiplication exponent. It is the first known subcubic algorithm for unrooted trees.The main idea behind our algorithm is the fact that to compute the tree edit distance between two unrooted trees, it is enough to compute the tree edit distance between an arbitrary rooting of the first tree and every rooting of the second tree.pl
dc.abstract.plProblem odległości edycyjnej między drzewami to naturalne uogólnienie klasycznego problemu odległości edycyjnej między słowami. Mając dane dwa uporządkowane drzewa T i Q z etykietami na krawędziach, odległość edycyjna pomiędzy T a Q jest zdefiniowana jako minimalny sumaryczny koszt operacji, które przekształcają drzewo T w drzewo Q. W jednej operacji możemy skontraktować krawędź, rozdzielić wierzchołek na dwa lub zamienić etykietę na dowolnej krawędzi.Dla ważonej wersji problemu, w której koszt każdej operacji zależy od typu operacji i etykiety na zmienianej krawędzi, znane są algorytmy działające w czasie O(n^3) zarówno dla drzew ukorzenionych jak i dla drzew nieukorzenionych. Istnienie prawdziwie podsześciennego, to jest działającego w czasie O(n^{3-ϵ}) algorytmu jest mało prawdopodobne, ponieważ implikowałoby ono istnienie podsześciennego algorytmu dla problemu APSP. Jednakże Mao pokazał ostatnio, że jeśli założymy, że każda operacja ma koszt jednostkowy, to odległość edycyjna między dwoma ukorzenionymi drzewami może być obliczona w czasie O(n^{2.9546}).W tej pracy pokazujemy jak uogólnić algorytm Mao tak, żeby działał dla drzew nieukorzenionych. Daje nam to pierwszy podsześcienny algorytm dla problemu nieważonej odległości edycyjnej między dwoma nieukorzenionymi drzewami działający w czasie O(n^{(7ω + 15)/(2ω + 6)}) ≤ O(n^{2.9417}), gdzie ω ≤ 2.373 jest wykładnikiem w czasie mnożenia macierzy. Nasz algorytm opiera się na fakcie, że aby obliczyć odległość edycyjną między dwoma nieukorzenionymi drzewami, wystarczy obliczyć odległość edycyjną pomiędzy dowolnym ukorzenieniem pierwszego drzewa a wszystkimi ukorzenieniami drugiego drzewa.pl
dc.affiliationWydział Matematyki i Informatykipl
dc.areaobszar nauk ścisłychpl
dc.contributor.advisorPolak, Adampl
dc.contributor.authorPióro, Krzysztofpl
dc.contributor.departmentbycodeUJK/WMI2pl
dc.contributor.reviewerPolak, Adampl
dc.contributor.reviewerKrawczyk, Tomasz - 129445 pl
dc.date.accessioned2022-10-31T22:54:19Z
dc.date.available2022-10-31T22:54:19Z
dc.date.submitted2022-10-27pl
dc.fieldofstudyinformatyka analitycznapl
dc.identifier.apddiploma-162924-247058pl
dc.identifier.urihttps://ruj.uj.edu.pl/xmlui/handle/item/303141
dc.languageengpl
dc.subject.entree edit distance, dynamic programming, matrix multiplicationpl
dc.subject.plodległość edycyjna między drzewami, programowanie dynamiczne, mnożenie macierzypl
dc.titleSubcubic algorithm for (Unweighted) Unrooted Tree Edit Distance.pl
dc.title.alternativePodsześcienny algorytm dla problemu nieważonej odległości edycyjnej pomiędzy nieukorzenionymi drzewami.pl
dc.typemasterpl
dspace.entity.typePublication
dc.abstract.enpl
The tree edit distance problem is a natural generalization of the classic string edit distance problem. Given two ordered, edge-labeled trees T and Q, the edit distance between T and Q is defined as the minimum total cost of operations that transform T into Q. In one operation, we can contract an edge, split a vertex into two or change the label of an edge.For the weighted version of the problem, where the cost of each operation depends on the type of the operation and the label on the edge involved, O(n^3) time algorithms are known for both rooted and unrooted trees. The existence of a truly subcubic O(n^{3-ϵ}) time algorithm is unlikely, as it would imply a truly subcubic algorithm for the APSP problem. However, recently Mao showed that if we assume that each operation has a unit cost, then the tree edit distance between two rooted trees can be computed in O(n^{2.9546}) time. In this paper, we show how to adapt Mao's algorithm to make it work for unrooted trees and we show an O(n^{(7ω + 15)/(2ω + 6)}) ≤ O(n^{2.9417}) time algorithm for the unweighted tree edit distance between two unrooted trees, where ω ≤ 2.373 is the matrix multiplication exponent. It is the first known subcubic algorithm for unrooted trees.The main idea behind our algorithm is the fact that to compute the tree edit distance between two unrooted trees, it is enough to compute the tree edit distance between an arbitrary rooting of the first tree and every rooting of the second tree.
dc.abstract.plpl
Problem odległości edycyjnej między drzewami to naturalne uogólnienie klasycznego problemu odległości edycyjnej między słowami. Mając dane dwa uporządkowane drzewa T i Q z etykietami na krawędziach, odległość edycyjna pomiędzy T a Q jest zdefiniowana jako minimalny sumaryczny koszt operacji, które przekształcają drzewo T w drzewo Q. W jednej operacji możemy skontraktować krawędź, rozdzielić wierzchołek na dwa lub zamienić etykietę na dowolnej krawędzi.Dla ważonej wersji problemu, w której koszt każdej operacji zależy od typu operacji i etykiety na zmienianej krawędzi, znane są algorytmy działające w czasie O(n^3) zarówno dla drzew ukorzenionych jak i dla drzew nieukorzenionych. Istnienie prawdziwie podsześciennego, to jest działającego w czasie O(n^{3-ϵ}) algorytmu jest mało prawdopodobne, ponieważ implikowałoby ono istnienie podsześciennego algorytmu dla problemu APSP. Jednakże Mao pokazał ostatnio, że jeśli założymy, że każda operacja ma koszt jednostkowy, to odległość edycyjna między dwoma ukorzenionymi drzewami może być obliczona w czasie O(n^{2.9546}).W tej pracy pokazujemy jak uogólnić algorytm Mao tak, żeby działał dla drzew nieukorzenionych. Daje nam to pierwszy podsześcienny algorytm dla problemu nieważonej odległości edycyjnej między dwoma nieukorzenionymi drzewami działający w czasie O(n^{(7ω + 15)/(2ω + 6)}) ≤ O(n^{2.9417}), gdzie ω ≤ 2.373 jest wykładnikiem w czasie mnożenia macierzy. Nasz algorytm opiera się na fakcie, że aby obliczyć odległość edycyjną między dwoma nieukorzenionymi drzewami, wystarczy obliczyć odległość edycyjną pomiędzy dowolnym ukorzenieniem pierwszego drzewa a wszystkimi ukorzenieniami drugiego drzewa.
dc.affiliationpl
Wydział Matematyki i Informatyki
dc.areapl
obszar nauk ścisłych
dc.contributor.advisorpl
Polak, Adam
dc.contributor.authorpl
Pióro, Krzysztof
dc.contributor.departmentbycodepl
UJK/WMI2
dc.contributor.reviewerpl
Polak, Adam
dc.contributor.reviewerpl
Krawczyk, Tomasz - 129445
dc.date.accessioned
2022-10-31T22:54:19Z
dc.date.available
2022-10-31T22:54:19Z
dc.date.submittedpl
2022-10-27
dc.fieldofstudypl
informatyka analityczna
dc.identifier.apdpl
diploma-162924-247058
dc.identifier.uri
https://ruj.uj.edu.pl/xmlui/handle/item/303141
dc.languagepl
eng
dc.subject.enpl
tree edit distance, dynamic programming, matrix multiplication
dc.subject.plpl
odległość edycyjna między drzewami, programowanie dynamiczne, mnożenie macierzy
dc.titlepl
Subcubic algorithm for (Unweighted) Unrooted Tree Edit Distance.
dc.title.alternativepl
Podsześcienny algorytm dla problemu nieważonej odległości edycyjnej pomiędzy nieukorzenionymi drzewami.
dc.typepl
master
dspace.entity.type
Publication
Affiliations

* The migration of download and view statistics prior to the date of April 8, 2024 is in progress.

Views
0
Views per month

No access

No Thumbnail Available
Collections