In recent years, an array of studies has focused on ‘translationese’ (i.e., unique features that manifest in translated texts, causing second language (L2) writings to be similar to translated texts but different from native language (L1) writings). This intriguing linguistic pattern has motivated scholars to investigate potential markers for predicting the divergence of L1 and L2 texts. This study builds on this work, evaluating the feature importance ranking of specific translationese markers, including standardized type-token ratio (STTR), mean sentence length, bottom-frequency words, connectives, and n-grams. A random forest model was used to compare these markers in L1 and L2 academic journal article abstracts, providing a robust quantitative analysis. We further examined the consistency of these markers across different academic disciplines. Our results indicate that bottom-frequency words are the most reliable markers across disciplines, whereas connectives show the least consistency. Interestingly, we identified three-word lexical bundles as discipline-specific markers. These findings present several implications and open new avenues for future research into translationese in L2 writing.
선박이 접안할 때 발생하는 접안에너지에 가장 영향력이 큰 요소는 접안속도이며, 과도한 경우 사고로 이어질 수 있다. 접안속도의 결정에 영향을 미치는 요소는 다양하지만 기존 연구에서는 일반적으로 선박 크기에 제한하여 분석하였다. 따라서 본 연구에서는 다양한 선박 접안속도의 영향요소를 반영하여 분석하고 그에 따른 중요도를 도출하고자 한다. 분석에 활용한 데이터는 국내 한 탱커부두의 선박 접안속도를 실측한 것을 바탕으로 하였다. 수집된 데이터를 활용하여 머신러닝 분류 알고리즘인 의사결정나무(Decision Tree), 랜덤포 레스트(Random Forest), 로지스틱회귀(Logistic Regression), 퍼셉트론(Perceptron)을 비교분석하였다. 알고리즘 평가 방법으로는 혼동 행렬에 따른 모델성능 평가지표를 사용하였다. 분석 결과, 가장 성능이 좋은 알고리즘으로는 퍼셉트론이 채택되었으며 그에 따른 접안속도 영향 요인의 중요도는 선박 크기(DWT), 부두 위치(Jetty No.), 재화상태(State) 순으로 나타났다. 이에 따라 선박 접안 시, 선박의 크기를 비롯하여 부두 위치, 재화 상태 등 다양한 요인을 고려하여 접안속도를 설계하여야 한다.