⬅ חזרה לאינדקס

איך לעשות מניפולציות\סינון בקבצי אקסל עם נתונים בעברית

🕒 פורסם בתאריך: 12/05/2024 22:28
שאלה שהיא לחלוטין לא קשורה לעולם השקעות ואולי רק בעקיפין להתפתחות אישית..



מנסה לעזור לאשתי . יש לה קובץ אקסל עם די הרבה עמודות ושורות ומידע שברובו הגדול מכיל מילים\משפטים בעברית. חלקו מספרים ואנגלית.



אני מהנדס תוכנה .היא צריכה לעשות כל מיני מניפולציות לקבוץ. לחלץ מידע, לבצע פילטרציות למיניהן.



אני רגיל לכתוב בפייתון או C++ , אבל לא בהקשר של עבודה עם קבצי אקסל.



אזפה יש 2 אתגרים שנתקלתי בהם. אשמח לעצות\טיפים-



1. מרבית היכולות שיש הן לקבצי CSV ולא קבצי XLS. מה בעצם האפשרויות שיש לי לעבוד עם פייתון או C++ , בשביל להיות מסוגל לגשת לקובץ בקלות ולבצע ניתוחים \אנליזות\מניפולציות לכל מיני עמודות. כל מיני סינונים בהתאם למה שכתוב? חשבתי אולי להמיר לCSV ואז לעבוד על הקובץ אבל לא בטוח איך החזרה לXLS אחרי זה כשזה בעברית תהיה מוצלחת?



2. עבודה על STRINGS - זה עושה רושם שלפחות חלק מספריות הפייתון שהשתמשתי בהן לא באמת יודעות מה לעשות עם השפה העברית - לא מזהות את זה כמשהו שהן מבינות וזה לא מאפשר לי לעשות כל מיני מניפולציות של STRINGS.
🕒 פורסם בתאריך: 13/05/2024 00:02
Pivot table באקסל



ניחוש פרוע: יש מצב שיתן מענה לחלק גדול מהצרכים בהכי פחות זמן



בעיקר לגבי ניתוח ואנליזה



לא בטוחה לגבי מניפולציה על גבי הדאטה עצמו



אבל אפשר לנסות



בגדול אני אומרת



שאנחנו, אנשי הכספים, עושים באקסל מה שאתם עושים בפייתון,



ואבא שלי עשה ב10 אצבעות...
🕒 פורסם בתאריך: 13/05/2024 05:36
בפייתון יש ספריות ל-XLSX ויש את פנדה, לדוגמה שיודעת למשוך XLSX או CSV ועוד כמה פורמטים שונים.



ג'פטו נתן את התשובה הבאה:



are there any python packages that work with csv & xlsx files?



Yes, there are several Python packages that can handle both CSV and XLSX files. Here are a few popular ones:

Pandas: Pandas is a powerful data manipulation library in Python. It provides easy-to-use functions to read and write data from and to CSV and Excel files.



OpenPyXL: OpenPyXL is a library for reading and writing Excel files (XLSX) in Python. It can handle Excel files with formulas, formatting, and charts.



xlrd and xlwt: These are older libraries for reading and writing Excel files (both XLS and XLSX formats), respectively. However, they are still commonly used and can be useful for simple tasks.



csv: Python's built-in csv module provides functionality for reading and writing CSV files. While it doesn't directly support Excel files, you can use it in conjunction with other libraries like Pandas to handle Excel files.



pyexcel and pyexcel-xlsx: These libraries provide a simple interface to handle various spreadsheet formats, including XLSX, CSV, and others.



Each of these libraries has its own strengths and weaknesses, so the best choice depends on your specific requirements and preferences.



לא יודע לגבי כל הספריות...



אבל לעברית יש את דפי הקידוד שלה ודי בטוח שהיא מוכלת ב-UTF-8.



וג'פטו הסכים איתי שלעברית ניתן להשתמש ב-BUILTINS של השפה.



אתה יכול לתת דוגמה ל-מחרוזת בעברית שלא הצלחת לעבוד איתה?
🕒 פורסם בתאריך: 13/05/2024 18:31
Pandas בפייתון יספק לך כל מה שתרצה
🕒 פורסם בתאריך: 16/05/2024 00:04
באמצעות איזה ממשק כל הפונקציונליות נעשית ?



אם מתוך האקסל, אפשר להשתמש בסקריפטים הפנימיים כדי לכתוב מרקו ב VB, כן, כאב ראש בהתחלה וחריקת שיניים, אבל בסוף זה עובד



אם אתה בונה תוכנה שרק רצה לשניה כדי לבצע את הפעולה, איך אתה נותן לה הוראות הרצה (פרמטרים וכו)?



כשאני עובד עם קבצי אקסל (ב PHP), אני מייבא נתונים מהגליון למערך ומבצע כל מה שצריך על המערך , ואז שותל את הנתונים שדורשים שינויי בתאים הרלוונטיים



בכל מקרה, בכל סיפריה שלא תבחר, שים לב שקיים קידוד UTF-8 על תאי המחרוזת שלך כשאתה שותל חזרה
🕒 פורסם בתאריך: 20/05/2024 22:17
חפש Power Query.



יש שם פונקציות וGUI שלא מצריך ידע בתכנות.



ככלל עבודה עם סטרינגים באקסל אינה ממולצת.



ויכול להיות שהPQ יתקשה להגיע לקידוד הנכון כשאוגרים כמה קבצים ביחד.