Mrudula K.

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Understood. Thank you!

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

I'm using zingg 0.3.4. Should I upgrade it?

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Vikas G. I'm getting an error saying ClientOptions has no attribute COLUMN

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Sure. I'll try this and get back to you

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Thank you so much for your help! 🙂

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Sure. Thank You zinggDir = "/models" modelId = "databricksdemotrial_120k" input_file = "/febrl120k/test.csv" try: # Stopwords recommendation phase options = ClientOptions([ClientOptions.PHASE, "recommend","--column", "firstName"]) args.setStopWordsCutoff(0.5) zingg = ZinggWithSpark(args, options) # Log the options generated # LOG.debug(f"Zingg options generated for stopwords recommendation: {vars(options)}") print (options) options_dict = vars(options) formatted_options = {key: str(value.getOptionValue) for key, value in options_dict.items()} LOG.debug(f"Zingg options generated for stopwords recommendation: {formatted_options}") zingg.initAndExecute() # Log the stopwords recommendations stopwordsForfname = spark.read.csv(zinggDir+"/"+modelId+"/stopWords/firstName") stopwordsForfname_list = stopwordsForfname.collect() LOG.info(f"Recommended stopwords for 'firstName': {stopwordsForfname_list}") except Exception as e: # Log any errors that occur during the stopwords recommendation phase LOG.error("Error occurred during stopwords recommendation:", exc_info=True) LOG.error(f"Error details: {e}") I'm running this on databricks (just for context)

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

I don't see anything wrong in the logs. And it is not showing me anything for 120k records as well.

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Sure. I'll get back to you with the logs

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

I tried with 0.2, 0.5 and 0.9. None of them return anything

Commented on Help with Stopword Optimization on Zingg Databrick...·Posted inHelp Zingg

Mrudula K.

Hi Sonal G., I tried to implement the stopwords, but I'm facing an issue with the recommender. It is creating folders for the columns I want to generate stopwords, but the folders are empty. I tried running the code on the sample data on your github repo as well, but I'm facing the same issue. Could you please help me out with this issue? Thank you!